Google Veo 2 - generator wideo
Veo 2 (źródło: Google)

Google Veo 2 to prawdziwa konkurencja dla generatora Sora OpenAI

Google zaprezentowało nową odsłonę generatora wideo. Zaawansowana technologia Veo 2 wyprzedza konkurencję i tworzy realistyczne filmy. Technologiczny gigant pokazał też trzecią odsłonę Imagen i nowe narzędzie.

Sztuczna inteligencja jest ważna dla Google

Zaangażowanie Google w rozwiązania oparte o sztuczną inteligencję jest coraz większe. Jednym z nich jest Gemini, którego można spotkać w kolejnych narzędziach – niedawno rozpoczęto wdrażanie AI do Dysku Google, bot pomaga już w wykonywaniu połączeń, a także w sterowaniu urządzeniami z kategorii Smart Home. Technologiczny gigant kilka dni temu oficjalnie zaprezentował też wersję Gemini 2.0, dzięki której sztuczna inteligencja ma być jeszcze bardziej przydatna.

Google nie mówi jednak „dość” nowościom na 2024 rok. Zespół DeepMind pokazał nową odsłonę swojego modelu przeznaczonego do generowania wideo. Sztuczna inteligencja Veo 2 ma konkurować z Sora – narzędziem twórców ChatGPT, które zadebiutowało w zeszłym tygodniu.

Google Veo 2: generator wideo, który rozumie prawa fizyki

Nowy model Google otrzymał kilka ulepszeń w porównaniu do poprzedniej wersji. Przede wszystkim tworzone filmy cechują się większym realizmem, wiernością i szczegółowością. Model ma dokładniej rozumieć zasady fizyki, dzięki czemu prezentowany na wideo ruch ma być nieco subtelniejszy i bliższy rzeczywistemu.

Według Google Veo 2 precyzyjnie interpretuje instrukcje, co sprawia, że twórca ma realny wpływ na generowane ujęcia, w tym styl, kąt czy sposób poruszania się. Oznacza to, że użytkownik może dokładnie opisywać, jak ma wyglądać dany film, zasugerować w podpowiedzi głębię ostrości, rozmyte tło, efekty kinematograficzne czy rodzaj obiektywu – np. 18 mm – a sztuczna inteligencja wykona szerokokątne ujęcie.

Nowy model osiąga wysokie wyniki w porównaniu do propozycji innych firm badawczych, szczególnie dobrze wypada pod względem ekspresji głosu. Veo 2 może generować pliki o długości jednej minuty w rozdzielczości 4K. Google zaznacza, że nowy model ma swoje ograniczenia, a tworzenie spójności w złożonych scenach nadal jest wyzwaniem, choć Veo 2 znacznie rzadziej generuje niepotrzebne dodatkowe elementy, takie jak np. dodatkowe palce.

Nowość wdrażana jest za pośrednictwem VideoFX, YouTube i Vertex AI. Aby wypróbować nowy model, konieczne jest zapisanie się na listę oczekujących w Google Labs, jednak na ten moment nie jest to możliwe w Polsce.

Google zaanonsowało też Imagen 3 i Whisk

Technologiczny gigant z Mountain View pochwalił się także nową odsłoną generatora obrazów – Imagen 3. Narzędzie ma teraz tworzyć jaśniejsze i lepiej skomponowane grafiki, wyróżniające się dokładnością w wybranym przez twórcę stylu – od fotorealizmu aż po anime. Podobnie jak Veo 2, tak i Imagen 3 zostało udostępnione za pośrednictwem ImageFX w ponad 100 krajach – niestety nie w Polsce.

Google pokazało też nowe narzędzie Whisk. Eksperyment polega na wprowadzeniu zdjęcia, sceny, stylu oraz opisu szczegółów, a następnie przetworzeniu tych danych wejściowych i stworzenia nowego obrazu. Nowość póki co również nie jest obsługiwana w Polsce.