Do tej pory nie sposób było nie odnieść wrażenia, że Google Gemini to sztuczna inteligencja, a nie człowiek. Nowy model Gemini Live może jednak zatrzeć to (nie mylne) wrażenie. Mogliście już widzieć coś podobnego wcześniej.

Google Gemini Live – sztuczna inteligencja, ale zachowująca się bardziej „po ludzku”

Jeśli oglądaliście prezentację ChatGPT-4o w maju 2024 roku, to Gemini Live działa podobnie. Konwersacja z nim również ma być bardziej „ludzka”, ponieważ interakcja nie ograniczy się już tylko do zadawania pytań i czekania na odpowiedź. Według Google użytkownicy będą mogli przeprowadzić z chatbotem „burzę mózgów” oraz przerywać mu w trakcie odpowiadania na pytania, jeśli na przykład dana część skłoniła ich do zadania dodatkowych pytań na temat poruszonej kwestii.

Z Gemini Live można również korzystać wtedy, gdy aplikacja działa w tle lub smartfon jest zablokowany, jak podczas rozmowy telefonicznej. Mniej „ludzkim” aspektem jest natomiast możliwość zatrzymania konwersacji i wrócenia do niej później. W realnym świecie nie da się tego zrobić. Podobnie jak zmienić głosu rozmówcy, a Gemini wzbogacił się dziś o 10 nowych głosów.

Gemini Live jest dostępny od dziś na smartfonach z Androidem wyłącznie w języku angielskim. Mogą z niego korzystać osoby, które mają wykupioną subskrypcję Google One AI Premium (w Polsce miesięczna opłata wynosi 97,99 złotych; roczna subskrypcja nie jest dostępna w tym przypadku).

Nowe funkcje Google Gemini

W najbliższych tygodniach zostaną udostępnione nowe rozszerzenia. Dzięki nim możliwe będzie na przykład poproszenie Gemini o dodanie do Keep notatki z listą składników potrzebnych do przygotowania potrawy, na którą przepis znajduje się w mejlu w aplikacji Gmail. Użytkownik będzie też mógł zrobić zdjęcie ulotki z informacją o koncercie i zapytać Gemini, czy ma wolny czas w dniu wydarzenia oraz ustawić przypomnienie, żeby kupić bilety.

źródło: Google

Na smartfonach z Androidem użytkownicy dostaną też do dyspozycji nakładkę Google Gemini. Po jej aktywacji będą mogli zadać pytanie dotyczące tego, co znajduje się na ekranie – na przykład znaleźć przepis na jakieś danie czy instrukcję, jak zrobić podobną rzecz. W przypadku YouTube będzie zaś można zadać pytanie dotyczące całego filmu – przykładowo poprosić o zrobienie listy wszystkich restauracji, wymienionych w wideoblogu z podróży oraz dodanie ich do Map Google.

Oprócz tego Google Gemini umożliwi stworzenie obrazu i przeciągnięcie go do innej aplikacji, na przykład Gmaila lub Wiadomości Google. W Polsce funkcja tworzenia obrazów nie jest jednak aktualnie dostępna.