Według wizji Microsoftu na rok 2030, tradycyjne urządzenia peryferyjne, czyli mysz i klawiatura, mogą ustąpić miejsca interfejsom opartym na sztucznej inteligencji i komunikacji głosowej. Firma twierdzi, że korzystanie z nich będzie wtedy tak archaiczne, jak dziś obsługa systemu DOS za pomocą interfejsu tekstowego.
Windows z AI i interakcją głosową, ale bez myszki?
David Weston, wiceprezes ds. bezpieczeństwa w Microsoft, w ramach serii „Windows 2030 Vision” przedstawił przewidywania dotyczące przyszłości systemów operacyjnych. Jego zdaniem, za pięć lat podstawowym sposobem obsługi Windowsa będzie język naturalny, a użytkownicy „będą mniej używać oczu, a więcej rozmawiać z komputerami”.
Kluczowym elementem mają być agenci AI, czyli inteligentne, autonomiczne programy, które będą mogły pełnić funkcje np. ekspertów ds. bezpieczeństwa w firmach. Takie wirtualne byty mają brać udział w spotkaniach na Teams, prowadzić rozmowy z pracownikami i wykonywać powierzone im zadania. Weston podkreśla, że chodzi o przejęcie przez AI powtarzalnych i czasochłonnych obowiązków, by ludzie mogli skupić się na bardziej kreatywnych działaniach.
Przyszłe generacje systemu Windows mają działać w sposób multimodalny. To znaczy, że komputer będzie „widział to, co widzimy”, „słyszał to, co słyszymy” i reagował na głosowe polecenia użytkownika. To ma umożliwić realizację bardziej złożonych operacji bez konieczności klikania i wpisywania komend, a więc nie będą potrzebne znane do tej pory urządzenia peryferyjne.
Ambitne plany kontra realne wyzwania
Microsoft nie kryje, że intensywnie inwestuje w rozwój AI. Gigant przeznaczył ponad 13 mld dolarów na OpenAI, a także m.in. 650 mln dolarów aktywów Inflection AI. Efektem jest coraz większa liczba funkcji opartych na AI w produktach firmy, np. w pakiecie Office i samym systemie Windows. Nie zawsze podoba się to jednak użytkownikom.
Wizja, w której mysz i klawiatura staną się zbędne już w 2030 roku, wydaje się wielu ekspertom przesadzona. Nawet jeśli technologie rozpoznawania głosu i przetwarzania języka naturalnego staną się powszechne, istnieją sytuacje, w których tradycyjne metody wprowadzania danych pozostają wygodniejsze, szybsze i bardziej precyzyjne. Najprostszym przykładem będzie praca z oprogramowaniem do edycji grafiki lub wideo. Jak obsłużyć to głosowo?
Mimo to, rozwój „agentów” AI może stopniowo przesuwać punkt ciężkości w stronę obsługi komputerów poprzez rozmowę i gesty. W perspektywie dłuższej niż pięć lat, możliwe jest, że dla wielu użytkowników tradycyjne urządzenia staną się opcją dodatkową, a nie podstawową.