OpenAI (twórca ChatGPT)
(źródło: OpenAI)

GPT-5 vs GPT-4o – który jest lepszy? Możesz to sam przetestować

Podczas premiery GPT-5 OpenAI przedstawiło go jako model „szybszy, mądrzejszy i bardziej przydatny” dla użytkowników. Jednak część z nich nie była zachwycona. Dziś każdy może sam sprawdzić, który model naprawdę woli w stworzonym na tym potrzeby blind teście.

GPT-5 to technicznie lepszy model, ale nie dla każdego

Całkiem niedawno byliśmy świadkami premiery modelu GPT-5, która wywołała niemałe poruszenie. Choć oferuje zauważalne postępy, np. w zakresie matematyki i kodowania oraz redukcję tzw halucynacji o 80%, to nie wszyscy użytkownicy byli zadowoleni z tej zmiany. W ciągu zaledwie 24 godzin od udostępnienia GPT-5, OpenAI musiało przywrócić GPT-4o, bo reakcje użytkowników były zbyt negatywne.

Powód? GPT-5 został celowo „ochłodzony”. Firma ograniczyła nadmierne pochlebstwa i przytakiwanie użytkownikowi, które w GPT-4o osiągały poziom 14,5%. W GPT-5 to zaledwie 6%. Zniknęły przypadkowo wpychane emoji, entuzjastyczny ton i „miękka narracja”. Zastąpiła je rzeczowa, chłodna odpowiedź. I, choć z perspektywy technicznej to krok naprzód, wielu użytkowników poczuło, że stracili AI, z którą mieli pewien rodzaj relacji.

Jak słusznie zauważa portal Venturebeat, wiele osób traktowało GPT-4o jak cyfrowego kompana, nie tylko asystenta. W badaniach MIT opisano przypadki, gdzie użytkownicy spędzali setki godzin z chatbotami, traktując je jak terapeutów czy towarzyszy. Po premierze GPT-5 w sieci pojawiły się wpisy o „stracie przyjaciela”, a nawet objawy psychicznego rozchwiania po nagłej zmianie osobowości modelu.

To bardzo ciekawy aspekt obecności chatbotów w naszym życiu, który jednak może mieć sporo negatywnych skutków dla naszego zdrowia psychicznego. Kilka dni temu media obiegła wstrząsająca wiadomość o 14-latku, którego rodzice pozwali OpenAI, ponieważ – według nich – ich dziecko popełniło samobójstwo właśnie pod wpływem rozmów i porad udzielanych przez ChatGPT.

Blind test GPT-5 vs GPT-4o. Możesz zrobić go w każdej chwili

W odpowiedzi na szerokie dyskusje użytkowników na temat tego, czy odpowiedzi nowego modelu są bardziej, czy mniej użyteczne, powstało ciekawe narzędzie, które jest czymś w rodzaju blind testu. Możecie znaleźć je pod tym adresem. Działa bardzo prosto. Użytkownik dostaje dwie odpowiedzi na ten sam prompt, ale bez informacji, która pochodzi z którego modelu. Po kilku rundach otrzymuje statystyki odnośnie tego, którą wersję faktycznie preferuje.

Wyniki? Są zaskakująco zróżnicowane. Wszystko zależy od tego, do jakich celów korzystamy z chatbota. „Techniczni użytkownicy”, programiści i osoby korzystające z AI do zadań logicznych częściej wybierają GPT-5. Ale osoby oczekujące wsparcia w pisaniu, rozmowie czy burzy mózgów, wciąż częściej głosują na GPT-4o.

Co więcej, wiele osób, które były przekonane, że preferują jeden model, odkrywa, że faktycznie częściej wybierały odpowiedzi tego drugiego.