google gemini translate
(Źródło: Google)

Dzięki Gemini niedługo lepiej dogadasz się z ludźmi (i nie tylko)

Podstawą komunikacji jest to, że chcemy kogoś rozumieć oraz być rozumiani. Są jednak różne przeszkody utrudniające to zadanie. Nowe funkcje – oparte o Google Gemini – spróbują zburzyć część tych barier.

Google Translate wzmocniony Gemini

Sztuczna inteligencja giganta z Mountain View chce poprawić doświadczenia płynące z aplikacji Tłumacz i Szukaj. Od teraz najpopularniejszy program do tłumaczenia wykorzysta Gemini, aby usprawnić je, dzięki lepszemu rozumieniu idiomów, lokalnych wyrażeń czy slangu. Dzięki temu szansa na dosłowne tłumaczenie zwrotów pokroju „wpaść jak śliwka w kompot” czy „wyjść jak Zabłocki na mydle” na inne języki powinna być o wiele rzadsza.

Póki co aplikacja będzie jednak lepiej radziła sobie ze zwrotami pokroju „not my cup of tea” czy „cool as a cucumber”, ponieważ ta aktualizacja dotyczy Ameryki oraz Indii i tłumaczeń pomiędzy językiem angielskim a hiszpańskim, hindi, niemieckim czy chińskim.

Google udostępnia również w formie bety możliwość tłumaczenia przez aplikację na żywo. Wystarczy kliknąć odpowiednią ikonkę, założyć słuchawki, a Gemini zacznie przenosić zasłyszane słowa na tekst, zachowując ton, emfazę czy tempo mówienia nasłuchiwanych osób. Ze względu na pozytywne wsparcie, beta została udostępnionia szerzej w USA, Meksyku i Indiach, działa na każdej parze słuchawek i wspiera ponad 70 języków. W 2026 roku możemy się natomiast spodziewać udostępnienia funkcji na systemie iOS.

Ostatnią nowością dla Tłumacza jest rozbudowanie narzędzi związanych z nauką języków. Od teraz informacje zwrotne mają jeszcze lepiej pomagać w praktyce języka, a system wyzwań codziennych i celów pomoże zachować ciągłość nauki. Funkcja została udostępniona w ponad 20 krajach i działa w następujących kombinacjach językowych:

  • nauka angielskiego w języku niemieckim i portugalskim,
  • nauka bengalskiego, mandaryńskiego, niderlandzkiego, niemieckiego, hindi, rumuńskiego i szwedzkiego w języku angielskim.

Pogadaj z AI

Dostępny w Google AI Studio, Vertex AI czy Gemini Live oraz Search Live model text-to-speech Gemini 2.5 Pro oraz Flash został właśnie ulepszony w trzech kluczowych kwestiach:

  • większa niezawodność zewnętrznych funkcji – w trakcie zbierania informacji w czasie rzeczywistym (np. podczas konwersacji) model wie lepiej, kiedy je zbierać i przekazywać odpowiedź w formie audio bez zaburzania płynności,
  • rozbudowane podążanie za instrukcjami – Gemini wie teraz, jak poradzić sobie ze skomplikowanymi instrukcjami. Zgodność z instrukcjami programistów wzrosła z ok. 84% do 90%,
  • płynna konwersacja – Gemini 2.5 Flash Native może od teraz pozyskiwać kontekst z poprzednich etapów rozmowy, dzięki czemu jego odpowiedzi są bardziej spójne.
google gemini 2.5 flash native audio
Wyniki Gemini 2.5 Flash Native Audio związane z benchmarkiem Complex Function Calling (Źródło: Google)

Za największą zmianę można jednak uznać natywne wsparcie dla tłumaczeń speech-to-speech, zarówno w formie nieprzerwanego słuchania, jak i dwukierunkowej konwersacji. Wśród najważniejszych funkcji Google wymienia:

  • wsparcie w 70 językach i ponad 2000 par językowych,
  • zachowanie intonacji tempa i barwy głosu mówcy,
  • rozumienie kilku różnych języków w ramach jednej konwersacji,
  • automatyczne rozpoznawanie języków,
  • zdolność do filtrowania hałasu, dzięki czemu konwersacje można przeprowadzać w głośnym otoczeniu.