Z powodzeniem napędza wirtualne boty i teraz nadszedł czas na wykonanie kolejnego kroku naprzód. Gemini Robotics to nowy model sztucznej inteligencji, opracowany przez firmę Google, którego zadaniem jest kontrolowanie działania fizycznych robotów.
Sztuczna inteligencja dla robotów – oto Gemini Robotics firmy Google
W towarzyszącej tej zapowiedzi notce prasowej firma Google przekonuje, że sztuczna inteligencja będzie rzeczywiście użyteczna i pomocna dla ludzi dopiero wtedy, gdy doczeka się ucieleśnienia. Właśnie w tym duchu opracowany został model Gemini Robotics, którego zdolności związane z rozumieniem i analizą tekstu, obrazu i dźwięku nie są ograniczone do sfery cyfrowej. Do tego uzupełnia je umiejętność rozumienia i reagowania na otaczający nas świat.
Tak naprawdę nowe modele są dwa i w obu przypadkach bazą jest Gemini 2.0, ujawniony w grudniu 2024 roku. Pierwszy nazywa się po prostu Gemini Robotics i dodaje modalność wyjściową do bezpośredniego sterowania robotami. Drugi – Gemini Robotics-ER – wyróżnia się zaawansowanym rozumieniem przestrzennym i rozumowaniem ucieleśnionym.
Co potrafi robot z Gemini?
Jeden i drugi pozwala robotom realizować rozmaite zadania w świecie rzeczywistym. Sprawia, że roboty są w stanie:
- odnajdywać się w różnych sytuacjach,
- rozumieć i szybko reagować na instrukcje oraz zmiany w otoczeniu,
- a także wykonywać czynności wymagające zręczności, czyli robić rzeczy, które ludzie zwykle potrafią robić rękami i palcami.
Tak przynajmniej przedstawiono to we wspomnianej notce, w której podkreślono również, że Gemini Robotics dokonuje dużego kroku naprzód pod względem wydajności w każdej z tych trzech kategorii.
Firma Google zwraca uwagę na zdolność Gemini Robotics do błyskawicznego wykonywania zadań, których dany robot nigdy wcześniej nie widział. Mowa o biegłości w radzeniu sobie z różnymi instrukcjami, środowiskami i obiektami – nawet tymi, które wymagają precyzyjnej manipulacji (jak składanie origami). Polecenia mogą być w dodatku formułowane naturalnym językiem.
Choć model Gemini Robotics był szkolony na dwuramiennej platformie robota ALOHA 2, to firma Google przekonuje, że bez problemu może on przybrać inną postać. Zarówno bardziej, jak i mniej humanoidalną.
Gemini Robotics-ER stanowi pod tym względem kolejny krok naprzód, ze względu na zaawansowane rozumienie świata dookoła. Google podaje taki przykład, że gdy tylko robot zobaczył kubek z kawą, błyskawicznie przygotował odpowiedni chwyt i obliczył bezpieczną trajektorię sięgania po niego. Krótko mówiąc: model samodzielnie ustala, czego potrzebuje, następnie generuje kod, po czym go wykonuje.
Odpowiedzialny rozwój
Mając świadomość nie tylko olbrzymich możliwości, ale i potencjalnych zagrożeń wynikających z rozwoju tego typu technologii, amerykański gigant zapewnia o holistycznym podejściu do kwestii bezpieczeństwa. Współpracuje z renomowanymi producentami robotów oraz ośrodkami akademickimi.