Firma OpenAI udostępniła model ChatGPT Images 2.0, mówiąc wprost o nowej erze generowania obrazów. Narzędzie to ma precyzyjnie wykonywać instrukcje i umożliwiać tworzenie przekonujących oraz spójnych wizualnie ilustracji.
Oto ChatGPT Images 2.0. Nowy poziom generowania obrazów?
ChatGPT Images 2.0 to olbrzymia aktualizacja generatora obrazów, który od kwietnia 2025 roku jest dostępny dla wszystkich użytkowników usługi ChatGPT. Ulepszone narzędzie ma sobie lepiej radzić na każdym poziomie: od rozumienia i przestrzegania instrukcji, przez precyzyjne rozmieszczanie i łączenie obiektów, aż po oferowanie szerokiego wachlarza stylów. Pożądany rezultat będzie można uzyskać z mniejszą liczbą komend, a efektem jego działania mają być gotowe do wykorzystania ilustracje.
Jednym z kluczowych udoskonaleń jest wzbogacenie modelu ChatGPT Images 2.0 o myślenie w technologicznym znaczeniu tego słowa. Daje mu to dostęp do aktualnych informacji z sieci, jak również umożliwia łączenie faktów oraz idei z obrazem. Ma to także pozwalać na lepsze zachowywanie spójności wizualnej.
Firma OpenAI zwraca również uwagę na sporą poprawę w kontekście renderowania drobnych elementów, a w szczególności gęstego tekstu. – Zamiast otrzymać coś, co mgliście przypomina to, co miałeś na myśli, otrzymujesz coś, czego faktycznie możesz użyć – przekonują twórcy. Dodają jeszcze, że ChatGPT Images 2.0 sprawniej funkcjonuje z innymi językami (w tym azjatyckimi).
Poza literami i znakami nowy model ma również wierniej odtwarzać style wizualne, o które proszą użytkownicy. Możliwe ma być wygenerowanie przekonujących obrazów w stylu mangi, komiksu, plakatu filmowego, albumu modowego, kadru filmowego itd. Twórcy chwalą się większą spójnością kompozycji i tekstury oraz elastycznością. Ta ostatnia objawia się ponadto w szerokim zakresie proporcji obrazu: od 3:1 do 1:3.
Co więcej, myślenie umożliwia generatorowi tworzenie spójnych wizualnie kolekcji i zbiorów grafik bazujących na tych samym pomyśle, ale w różnych proporcjach i językach albo też różnych motywów, ale w jakiś sposób ze sobą powiązanych lub sekwencyjnie się uzupełniających.
ChatGPT Images 2.0 jest już dostępny dla wszystkich
Model ChatGPT Images 2.0 jest już udostępniany. Trafia do wszystkich użytkowników narzędzia ChatGPT, aplikacji Codex oraz API. Wersja z dostępem do głębokiego rozumowania jest dostępna w subskrybcji ChatGPT Plus, Pro i Business.





