Gemini nowe funkcje
(źródło: Google)

Gemini będzie potężniejsze i bardziej osobiste. Google ogłosiło sporo nowości

Podczas Google I/O 2025 – co raczej nie jest dla nikogo zaskoczeniem – sporo uwagi poświęcono Gemini. Firma z Mountain View obiecała m.in. potężniejszą sztuczną inteligencję.

Spory zastrzyk nowości dla aplikacji Gemini

Tydzień temu w trakcie Android Show poznaliśmy Androida 16 i Wear OS 6. Teraz z kolei przyszła pora na kolejne nowości, którymi pochwalono się podczas Google I/O 2025. Konferencja zaczęła się pokazem możliwości AI i to właśnie sztuczna inteligencja została potraktowana z największym priorytetem.

Warto zaznaczyć, że Google nie pokazało zestawu funkcji, które w bliżej nieokreślonej przyszłości zostaną udostępnione użytkownikom. Wiele z nowości już za moment będzie można sprawdzić na własnej skórze. Dobrym przykładem są funkcje skierowane dla aplikacji Gemini.

Gemini Live, oferujące możliwość prowadzenia bardziej naturalnej rozmowy z AI, pomoże zarówno miłośnikom Androida, jak i osobom preferującym iOS. Funkcja pozwalająca wykorzystać dane z kamery i mikrofonu jest teraz bezpłatna na obu platformach.

Gemini Live
(źródło: Google)

Co więcej, w najbliższych tygodniach Gemini Live ma głębiej integrować się z codziennym życiem użytkownika. Pojawi się współpraca z aplikacjami i usługami Google (m.in. Mapy Google, Notatki czy Kalendarz), aby AI mogło stać się bardziej osobistym asystentem. Ma to również pomóc w wielu codziennych czynnościach, jak zapisywanie wydarzeń w kalendarzu czy sprawdzenia informacji o lokalnej restauracji.

Imagen 4, model do generowania obrazów, od dziś zacznie być wdrażany w aplikacji Gemini. Jego możliwości będzie mógł sprawdzić każdy zainteresowany – Google obiecuje, że obrazy będą charakteryzować się m.in. wysokim poziomem realizmu i szczegółowości. Jeszcze większe wrażenie podczas Google I/O zrobił Veo 3, który umożliwia generowanie świetnie wyglądających filmów. Niestety, początkowo skorzystają z niego subskrybenci Google AI Ultra w USA.

Wśród ogłoszonych nowości mamy też generowanie raportów z wykorzystaniem Gemini Deep Research (m.in. możliwość połączenia danych prywatnych z dostarczonych plików z danymi dostępnymi publicznie). Model Gemini 2.5 Canvas pozwoli tworzyć jeszcze bardziej interaktywne infografiki, quizy czy podcasty audio, a model 2.5 Pro ma szybko przemienić złożone pomysły w działający kod.

Warto dodać, że Gemini wchodzi do Google Chrome. W pierwszej fazie na komputerach z Windowsem i macOS. Niestety, obecnie dostępne funkcje mogą sprawdzić tylko subskrybenci Google AI Pro i Google AI Ultra w USA.

Modele Gemini 2.5 mają być jeszcze lepsze

Możliwości Gemini 2.5 mogliśmy poznać już wcześniej. Teraz natomiast Google ogłosiło szereg ulepszeń, które będą odczuwalne dla użytkowników. Osoby korzystające z wersji 2.5 Pro i 2.5 Flash zyskają bardziej naturalne wrażenia z rozmów głosowych, a także wyższy poziom bezpieczeństwa. Firma zaznaczyła, że rodzina modeli Gemini 2.5 jest tą najbezpieczniejszą z oferowanych i powinna być odporna chociażby na złośliwe wstrzykiwanie informacji do pobieranych danych.

Model Gemini 2.5 Flash ma być teraz jeszcze wydajniejszy, a w przypadku 2.5 Pro startują testy potężnego trybu Deep Think. Wspomniany Deep Think wykorzystuje nowe techniki badawcze, dzięki którym może rozważać wiele hipotez przed udzieleniem odpowiedzi. Google chce się skupić na bezpieczeństwie i poprawności dostarczanych wyników, więc obecnie z modelu będą mogli korzystać zaufani testerzy.

Gemini Pro Deep Think
(źródło: Google)

Firma wspomniała jeszcze o udostępnieniu możliwości wykorzystania Project Mariner w Gemini API i Vertex AI, a także ulepszonemu środowisku dla programistów – m.in. wsparcie MCP.