OpenAI postanowiło długo nie zwlekać z odpowiedzią na DeepSeek, który wygenerował ogromny szum medialny i zachwycił wiele osób. Amerykanie udostępnili model o3-mini w dwóch wersjach. Każda z nich specjalizuje się w czymś innym. Jak wypada po pierwszych testach?
OpenAI o3-mini to odpowiedź na DeepSeek
W ostatnich dniach w świecie sztucznej inteligencji wiele się działo. OpenAI wypuściło operatory, a DeepSeek stał się jednym z najpopularniejszych rozwiązań z zakresu LLM. Na odpowiedź OpenAI nie trzeba było długo czekać, gdyż ChatGPT doczekał się nowego modelu, z którego może korzystać, czyli o3-mini w dwóch wersjach. Standardowej, lepszej w „rozumowaniu”, a także o3-mini high specjalizowanej w logice i kodowaniu.
Zgodnie z tym, co pisze OpenAI, o3-mini to najnowszy i najbardziej opłacalny model z ich serii „rozumowania”. Pierwotnie był zapowiedziany na końcówkę 2024 roku, ale finalnie wyszedł dopiero teraz. Amerykańska korporacja podkreśla, że jego szczególną siłą są nauki ścisłe, zwłaszcza matematyka, a także kodowanie. Co ciekawe, nowy model ma mieć trzy opcje „wysiłku”: niską, średnią oraz wysoką. Domyślnie korzysta ze średniej, ale w ustawieniach można to zmienić.
Kto może korzystać z OpenAI o3-mini?
Model OpenAI o3-mini już trafił w ręce użytkowników ChatGPT Plus, Team i Pro. Z kolei dostęp w enterprise pojawi się w najbliższych tygodniach, kiedy to model zastąpi o1-mini. OpenAI potroiło również limit szybkości dla użytkowników Plus i Team z 50 poleceń z o1-mini do 150 poleceń dziennie z o3-mini. Z kolei posiadacze Pro będą mieli nieograniczony dostęp zarówno do o3-mini, jak i o3-mini-high. Użytkownicy darmowi mogą wypróbować ten model wybierając opcję „reason” lub generując odpowiedź na nowo.
Jak działa OpenAI o3-mini?
Na potrzeby tego artykułu postanowiłem przetestować dla Was o3-mini. Potrzebowałem programu, który automatycznie podmieniałby wszystkie pliki z rozszerzeniem „png” we wskazanym folderze na „jpg”, więc testy zacząłem od o3-mini high. Po drodze pojawiły się komplikacje z „pip”, a także modyfikacja funkcji, gdyż chciałem, żeby na końcu usuwał wersję z „png” z folderu. Z każdym z tych trzech problemów do rozwiązania nowy model OpenAI poradził sobie bez problemu. Stosując te same prompty w poprzednich wersjach musiałem się mocno namęczyć, żeby otrzymać rezultat.



O ile w prostym kodowaniu o3-mini high poradził sobie bez problemu, tak standardowy o3-mini w zadaniu sugerowanym przez ChatGPT nie był już tak dobry. Poprosiłem go o przygotowanie planu treningowego. Po pierwszej odpowiedzi sprecyzowałem cele oraz wytyczne.



Model nie poradził sobie zbyt dobrze, bo zaproponował klasyczne ćwiczenia, które w średni sposób aktywują mięśnie wskazane przeze mnie w wytycznych. Trudno by było nimi osiągnąć porównywalny efekt do ćwiczeń zaproponowanych mi przez trenera personalnego.
Jednym słowem – więcej marketingowych sztuczek o „rozumowaniu”, a mniej realnych efektów. Zwłaszcza że wytypowałem zadanie z podpowiedzi ChataGPT, więc model powinien sobie z nim poradzić.