Jak „kombinuje” sztuczna inteligencja? Google pozwala to podejrzeć

Firma Google udostępniła nowy model sztucznej inteligencji o nazwie Gemini 2.0 Flash Thinking. Jest to eksperymentalna technologia, rozwiązująca złożone zadania logiczne, rozkładając je na czynniki pierwsze i przedstawiając użytkownikowi cały proces, krok po kroku.

Gemini 2.0 Flash Thinking – Google udostępnia model „myślącej” sztucznej inteligencji

Eksperymentalna wersja Gemini 2.0 Flash została udostępniona w ubiegłym tygodniu. To właśnie na niej bazuje nowy model Gemini 2.0 Flash Thinking. To specjalne rozwiązanie z kategorii rozumujących, a więc skupione nie tyle na podawaniu samej odpowiedzi na podstawie wyszukiwalnych danych, lecz na rozwiązywaniu złożonych problemów w sposób zbliżony do tego, jak realizuje takie zadania człowiek.

W Gemini 2.0 Flash Thinking można upatrywać bezpośredniej konkurencji dla modelu o1 organizacji OpenAI. Ten ostatni został zaprezentowany we wrześniu 2024 roku, a całkiem niedawno, bo już w grudniu, wypuszczono go w pełnej wersji – bez ograniczeń mogą z niego korzystać abonenci planu ChatGPT Pro, a z pewnymi limitami subskrybenci niższych planów.

W przypadku rozwiązania firmy Google mówimy wciąż o wersji rozwojowej. Testowanie możliwości tego modelu zostało oddane w ręce specjalistów korzystających z Gemini API oraz platformy Google AI Studio. Ograniczenia, jakich należy być świadomym, to: limit wprowadzania tokenów równy 32000, limit wyprowadzania tokenów równy 8000, możliwość wprowadzania wyłącznie tekstu i obrazu oraz otrzymywanie odpowiedzi jedynie w formie czystego tekstu.

Jak działa Gemini 2.0 Flash Thinking, czyli jak „kombinuje” sztuczna inteligencja?

No dobrze, ale jak działa Gemini 2.0 Flash Thinking? Model stara się imitować ludzki proces myślowy – dążyć do rozwiązania problemu (np. obliczeń), kwestionować i weryfikować wyniki, a także dzielić całe zadanie na wiele mniejszych. Co ciekawe, cały przebieg można obserwować, aby jeszcze lepiej zrozumieć, z czego wynika taki, a nie inny rezultat. Świetnie widać to na przykładzie przedstawionym przez Jeffa Deana – głównego naukowca w zespole Google DeepMind:

Want to see Gemini 2.0 Flash Thinking in action? Check out this demo where the model solves a physics problem and explains its reasoning. pic.twitter.com/Nl0hYj7ZFS
— Jeff Dean (@JeffDean) December 19, 2024

Model Gemini 2.0 Flash Thinking ma rozwiązywać problemy w sposób jak najbardziej zrozumiały dla człowieka, cechując się przy tym wysoką wydajnością działania. Zakres jego zastosowań jest dość wąski, bo – z oczywistych raczej względów – skupia się przede wszystkim na problemach matematycznych, fizycznych czy też technicznych.

Potencjał zaś jest olbrzymi.

Zobacz również