ChatGPT marki OpenAI otrzymuje dostęp do nowego modelu generatora obrazów GPT-4o
GPT-4o trafia do ChatGPT (źródło: OpenAI)

ChatGPT zyskał zaawansowany generator obrazów. Tekst nie jest dla niego problemem

OpenAI wdrożyło nowy model generatora obrazów GPT-4o do popularnego bota ChatGPT. Potrafi naprawdę sporo i możesz wypróbować jego możliwości, choć jest dość spore ograniczenie…

Chatbot OpenAI otrzymał nowe możliwości

Od bota ChatGPT wszystko się zaczęło… Narzędzie zostało oficjalnie uruchomione 30 listopada 2022 roku i od razu przyciągnęło uwagę całego świata. W ślad za OpenAI poszli najwięksi giganci, w tym Microsoft z Copilotem czy Google z Gemini, który zadebiutował już w wersji 2.5. Sztuczna inteligencja u każdego twórcy jest intensywnie rozwijana i zyskuje coraz bardziej zaawansowane funkcje.

OpenAI właśnie zaanonsowało nowy generator obrazu, wbudowany do bota ChatGPT. Według firmy jest on „najbardziej zaawansowaną” propozycją, jaką dotychczas udostępniono. Model GPT-4o ma sprawić, że tworzone z użyciem AI grafiki będą nie tylko ładne, ale również użyteczne. Co potrafi w rzeczywistości?

ChatGPT z nowym generatorem obrazu – co oferuje?

Na przykładowych zdjęciach udostępnionych przez OpenAI przedstawiono możliwości najnowszego rozwiązania. Bot może teraz tworzyć obrazy o bardzo dużej szczegółowości i spójności, a także umieszczać na nich zrozumiały i logiczny tekst. Jak zaznaczają twórcy „obraz jest wart tysiąca słów, jednak lokowanie kilku słów w odpowiednim miejscu może podnieść znaczenie całego obrazu”. Dlatego tak istotne jest, że wreszcie udaje się generować grafiki z mającym sens tekstem, podkreślającym kontekst całości.

OpenAI zaznacza również, że najnowszy model udostępniony w ChatGPT może nie tylko generować pojedyncze obrazy, ale też pozwolić użytkownikowi na ich udoskonalanie w oparciu o podpowiedzi przekazywane botowi w języku naturalnym. GPT-4o może obsłużyć około 10 do 20 różnych obiektów na obrazie, podczas gdy inne systemy mają często problemy z wygenerowaniem od 5 do 8 obiektów.

Materiałem źródłowym dla bota może być nie tylko tekst, ale także grafiki, z których powinien skorzystać lub je odpowiednio przerobić. Mogą być to np. szkice przekształcane na fotorealistyczne ujęcia, instrukcje czy przepisy.

GPT-4o – ograniczenia i dostępność generatora

Twórcy zaznaczają, że model nie jest doskonały, ma pewne ograniczenia, w tym może umieszczać na grafikach błędne informacje lub zbyt obcinać obrazy.

Ulepszony ChatGPT jest już dostępny dla zalogowanych użytkowników w wariancie Free, a także dla subskrybentów planów Plus, Pro i Team. Wkrótce z nowej możliwości będą mogli skorzystać również użytkownicy Enterprise i Edu.

Warto jednak zaznaczyć, że w wariancie bezpłatnym, z którego korzystam, udało się wygenerować zaledwie trzy grafiki – wygląda na to, że jest to limit dzienny.