Google Veo 3.1 AI
źródło: Google

Kolejny poziom generowania wideo osiągnięty przez AI

Dzięki Photo to Video model Veo 3.1 potrafi ożywiać zdjęcia, zamieniając je w krótkie klipy wideo. Funkcja Ingredients to Video idzie natomiast o krok dalej, przygotowując filmiki na podstawie jednego lub nawet kilku obrazów oraz promptu stanowiącego dookreślenie tego, co tak właściwie chcemy uzyskać. Firma Google wypuściła aktualizację, która znacząco usprawnia tę drugą opcję.

Veo 3.1 usprawnia Ingedrients to Video. Firma Google przygotowała dużą aktualizację AI

W ramach aktualizacji generator Veo 3.1 zyskał narzędzia, które pozwolą mu tworzyć bardziej ekspresyjne i kreatywne, a przy tym przekonujące materiały wideo, nawet jeśli prompt jest bardzo prosty. Producent obiecuje również bogatszą narrację oraz – przede wszystkim – większą spójność, jeśli chodzi o bohaterów klipu. Do tej pory bowiem nierzadko postać mocno zmieniała wygląd, kiedy tylko przechodziła do innej scenerii.

Bardziej spójne mają być także pozostałe obiekty czy tła. Veo 3.1 pozwala na wielokrotne wykorzystanie tych samych materiałów z zachowaniem ich tożsamości. Wreszcie, model ma również w bardziej przemyślany i naturalny sposób łączyć poszczególne elementy (ludzi, tekstury, tła…).

Veo wygeneruje pionowe wideo – w sam raz na TikToka

Jako najważniejszą spośród nowości w tej aktualizacji firma Google wymienia jednak coś innego. Chodzi mianowicie o możliwość generowania filmów w pionowym formacie 9:16 – bardziej przyjaznym urządzeniom mobilnym i pasującym chociażby do charakterystyki serwisów YouTube Shorts lub TikTok.

Do tego Veo 3.1 pozwala na domyślne tworzenie filmów w rozdzielczości Full HD (1080p), a dzięki nowej technologii skalowania osiągalne jest nawet 4K (2160p). To drugie wyłącznie podczas korzystania z Flow, Gemini API lub Vertex AI.

Wszystko to razem ma sprawiać, że filmy wygenerowane przy użyciu narzędzia Ingredients to Video w Veo 3.1 będą wyglądać realistycznie, przekonująco, naturalnie i spójnie, przy zachowaniu ogólnej wysokiej jakości. Aby zawsze możliwe było ustalenie, że są treściami wygenerowanymi przez AI, każdy materiał jest oznaczony niewidocznym cyfrowym znakiem wodnych (SynthID). Z jego odczytaniem radzi sobie chociażby Gemini – zawsze więc można go spytać, kiedy ma się jakieś wątpliwości (a te mogą pojawiać się coraz częściej).

Redaktor