Modele GenAI Gemini 2026
źródło: Google

Google osiąga nowy poziom generowania obrazów. Wideo też

Sztuczna inteligencja Google nauczyła się nowych sztuczek. Teraz potrafi jeszcze szybciej generować obrazy, upraszcza do granic możliwości generowanie i edytowanie klipów wideo, a do tego w mig podsumowuje olbrzymie pokłady informacji.

Google wprowadza Nano Banana 2 Lite. Generowanie jakościowych obrazów nigdy nie było tak szybkie

Nano Banana Pro (czyli Gemini 3 Pro Image) to najbardziej zaawansowany model, oferujący wysoką jakość i precyzję przy generowaniu obrazów, ale potrzebujący na to dużo czasu i zasobów. Nano Banana 2 (Gemini 3.1 Flash Image) robi to nieco mniej spektakularnie, ale też szybciej i taniej. Teraz dołącza do nich trzeci wariant: Nano Banana 2 Lite (Gemini 3.1 Flash-Lite Image), który jest w stanie tworzyć obrazy niemalże w czasie rzeczywistym i w wyjątkowo efektywny kosztowo sposób.

Nowy model ma sprawdzić się w sytuacjach, w których obrazów potrzeba jak najszybciej i oczekuje się przyzwoitej jakości. Choć potrafi generować znaki alfanumeryczne, raczej nie nadaje się do tworzenia skomplikowanych infografik ani też serii realistycznych obrazów z elementami wspólnymi, ale do szybkiej ilustracji tematu zdecydowanie tak. Potrafi zamienić tekst na grafikę w standardowej rozdzielczości (1K) w zaledwie 4 sekundy, a jej koszt wynosi niespełna 3,5 centa.

Model Nano Banana 2 Lite jest już dostępny w obszernym katalogu narzędzi Google: począwszy od trybu AI w wyszukiwarce i aplikacji Gemini, przez Google AI Studio, aż po Gemini API i Gemini Enterprise Agent Platform.

Gemini Omni Flash potrafi zrobić czary w kontekście wideo

Drugą z wprowadzonych nowości jest Gemini Omni Flash – wszechstronny model przeznaczony zarówno do generowania, jak i edycji materiałów wideo. Umożliwia tworzenie i udoskonalanie treści na podstawie poleceń wprowadzanych naturalnym językiem i multimodalnych danych wejściowych, jak również synchronizację tekstu z akcją.

Ma to robić bardzo efektywnie – zarówno w kontekście czasu, jak i kosztów. Są też jednak ograniczenia – po pierwsze: obecnie nie potrafi wygenerować klipu dłuższego niż 10 sekund i miewa również trudności z zachowaniem spójności postaci podczas zmiany scen (ale prace nad rozwiązaniem tego problemu trwają).

Model Gemini Omni Flash jest dostępny w aplikacji Gemini i narzędziu Flow, a także w API, usłudze Google AI Studio i Gemini Enterprise Agent Platform.

Gemini pomoże też w przyswajaniu informacji – wygeneruje klip albo pokaz slajdów

Pozostając w temacie wideo, warto wspomnieć o kolejnej nowości – udostępnianej w ramach aktualizacji narzędzia NotebookLM. Otóż jest to funkcja Short Video Overviews, która generuje 60-sekundowe klipy w formacie pionowym, streszczające notatki lub dokumenty naukowe.

To rozwiązanie dla osób, które potrzebują pigułki zawierającej kluczowe informacje i wnioski w danym temacie. Dołącza do wcześniej wprowadzonych, a skupiających się na dłuższej formie funkcjach Explainer i Cinematic Video Overviews.

W podsumowywaniu dużych pokładów informacji dobrze sprawdzają się też pokazy slajdów. Tak się składa, że w ich kreatorze – a więc aplikacji Prezentacje Google – pojawiła się opcja generowania całych pokazów (wcześniej możliwe było jedynie przygotowywanie pojedynczych slajdów).

Gemini w Prezentacjach Google jest w stanie przeanalizować otrzymane materiały i przygotować na ich podstawie (oraz słownych podpowiedzi, a ewentualnie także przykładowej prezentacji jako wzornika stylu) pełnowymiarowy pokaz slajdów. Jest on w dodatku całkowicie edytowalny (użytkownik może modyfikować układ, zmieniać tekst i wprowadzać inne poprawki).

Zanim przejdzie do generowania, aplikacja spyta użytkownika o to, w jakim tonie powinna być utrzymana prezentacja. Przedstawi również konspekt, który można zaakceptować, odrzucić lub zmodyfikować, aby ograniczyć konieczność wprowadzania niezliczonych poprawek po wszystkim.

Póki co funkcja ta działa wyłącznie w języku angielskim i jest dostępna dla użytkowników opłacających subskrypcje Google AI Pro lub Google AI Ultra, a także Google AI Pro for Education, Business Standard, Business Plus, Enterprise Standard i Enterprise Plus.