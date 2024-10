Google ponownie aktualizuje swojego chatbota Gemini. Sztuczna inteligencja w przeglądarce i aplikacji obsłuży teraz ulepszony model generatora obrazów Imagen 3. Nowość jest dostępna dla wszystkich za darmo, choć jest niewielki haczyk.

Rozwój sztucznej intligencji Google Gemini

Pod koniec sierpnia Google zaprezentowało Gems, czyli indywidualnie tworzone przez użytkowników chatboty, które mogą zostać wyspecjalizowane w konkretnej, wybranej dziedzinie. Dostęp do tej ciekawej formy sztucznej inteligencji otrzymali subskrybenci Gemini Advanced, Business i Enterprise. Oczywiście są też gotowe Gemsy, a wśród nich m.in. nauczyciel przedstawiający wiedzę w bardziej przystępny sposób, burza mózgów na konkretny temat, a także korektor tekstu czy partner kodowania.

Już podczas prezentacji Gems gigant wspomniał, że narzędzie Imagen 3 będzie udostępnione dla szerszej publiczności oraz we wszystkich obsługiwanych przez Gemini językach. Wreszcie Google ogłosiło, że Imagen 3 działa już bezpośrednio w bocie Gemini. Użytkownicy z Polski i całego świata, którzy mają dostęp do chatbota, mogą puścić wodze fantazji i wyobraźni.

Gemini obsługuje Imagen 3 (screen: Natalia Kania-Kuc)

Co oferuje Imagen 3 w Gemini?

Imagen 3 to dotychczas najlepszy generator obrazów oferowany przez Google. Jego zasada działania jest prosta – opisujesz to, co chcesz zobaczyć, a bot na podstawie Twoich podpowiedzi tekstowych w kilka sekund tworzy obraz. Grafiki cechują się szczegółowością, bogatym oświetleniem i mniejszą liczbą artefaktów w porównaniu do poprzednich modeli.

Najbardziej zaawansowany generator giganta z Mountain View nie tylko tworzy obrazy o wysokiej jakości, ale przede wszystkim lepiej rozumie oczekiwania użytkownika i przesyłane przez niego odpowiedzi w języku naturalnym. Model może opracowywać fotorealistyczne ujęcia z wykorzystaniem szerokiej gamy formatów i stylów. Wystarczy, że dobrze opiszesz każdy szczegół obrazu. Niektóre grafiki naprawdę trudno odróżnić od rzeczywistych zdjęć.

Jest jedna rzecz, która niestety nie działa. Imagen 3 w Gemini nie wygeneruje bezpłatnie grafik, na których są ludzie. Jak wynika z informacji udostępnionych przez portal The Verge – opcję tę gigant zaczął udostępniać w maju 2024 roku, jednak wyłącznie subskrybentom Gemini Advanced, Business i Enterprise (w języku angielskim) w ramach wczesnego dostępu.