Mówi się, że pośpiech jest złym doradcą, ale w tym przypadku ma być lepiej. Znacznie lepiej. Aż wręcz zadziwiająco lepiej. Google przedstawiło właśnie swój model nowej generacji – Gemini 1.5.

Oto Gemini 1.5, nowy model Google

Początkowo firma z Mountain View goniła twórców ChatGPT, czyli OpenAI, ale teraz chce być jednym z liderów w tej branży. Na początku grudnia 2023 roku zaprezentowała model Gemini 1.0, a dziś, niewiele ponad dwa miesiące później, zaanonsowała model Gemini 1.5, którego możliwości są zaskakujące i zadziwiające.

Według deklaracji Google, Gemini 1.5 zapewnia radykalnie zwiększoną wydajność, a dzięki nowej architekturze Mixture-of-Experts (MoE) udało się zwiększyć wydajność modelu w szkoleniu i obsłudze. W pierwszej kolejności firma z Kalifornii udostępniła do wczesnych testów model Gemini 1.5 Pro, który – jak twierdzą Amerykanie – działa na poziomie podobnym do Gemini 1.0 Ultra. Tutaj warto przypomnieć, że jest on dostępny od zaledwie tygodnia i na dodatek trzeba zapłacić za korzystanie z niego.

I chociaż Gemini 1.5 Pro jest średniej wielkości modelem multimodalnym, zoptymalizowanym pod kątem skalowania w szerokim zakresie zadań, to topowy Gemini Ultra szybko przestał być unikalny, skoro oba modele mają działać na podobnym poziomie. To jednak dobra wiadomość dla użytkowników i dowód na to, że sztuczna inteligencja rozwija się w tym obszarze szalenie szybko.

Google informuje również, że Gemini 1.5 Pro wprowadza także przełomową funkcję eksperymentalną w rozumieniu długiego kontekstu. Jest on wyposażony w standardowe okno kontekstowe zawierające 128 tys. tokenów, ale w ramach testów ograniczona grupa programistów i klientów korporacyjnych może wypróbować tę funkcję w oknie kontekstowym zawierającym do 1 mln tokenów.

W praktyce oznacza to możliwość przetworzenia 1 godziny wideo, 11 godzin audio, bazy kodów z ponad 30 tys. linijek kodu lub ponad 700 tys. słów. Dla porównania, w przypadku Gemini 1.0 maksimum to „zaledwie” 32 tys. tokenów. Milion nie jest jednak górną granicą w Gemini 1.5 Pro, gdyż Google w swoich badaniach przetestowało także do 10 mln tokenów.

Gemini 1.5 Pro jest tak dobry jak Gemini 1.0 Ultra

Zostało już wspomniane, że Gemini 1.5 Pro jest w stanie działać na podobnym poziomie co Gemini 1.0 Ultra. Ponadto Google deklaruje, że oba modele wykazują się podobną wydajnością w testach porównawczych w rozumieniu i analizie tekstu, kodu, obrazu, dźwięku i wideo. Względem Gemini 1.0 Pro nowy model przewyższa zaś swojego poprzednika w 87% testów porównawczych.

Co więcej, Google podaje, że Gemini 1.5 Pro wykazuje również imponujące umiejętności „uczenia się w kontekście”, co oznacza, że ​​może nauczyć się nowej umiejętności na podstawie informacji podanych w długim komunikacie, bez konieczności dodatkowego dostrajania.

Aktualnie Gemini 1.5 Pro znajduje się na etapie testów – Google nie informuje, kiedy zostanie wdrożony i udostępniony dla wszystkich użytkowników modelu (a z Gemini 1.0 Pro można korzystać już w Polsce i w polskim języku).