microsoft-nowe-modele-ai
źródło: Microsoft
Sztuczna Inteligencja

Microsoft nie potrzebuje już OpenAI? Ma dwa własne modele sztucznej inteligencji

Piotr Bukański·
Strona główna
Sztuczna Inteligencja
Microsoft nie potrzebuje już OpenAI? Ma dwa własne modele sztucznej inteligencji

Microsoft ogłosił opracowanie własnych głosowych modeli AI. To MAI-Voice-1 oraz MAI-1-preview. To pierwszy tak wyraźny krok w stronę uniezależnienia się od OpenAI i stworzenia własnej podstawy technologicznej w tym zakresie.

Jak dobrze mówi nowy model AI Microsoftu?

Microsoft do tej pory korzystał z integracji modeli OpenAI w ramach usługi Azure i Copilota. Teraz jednak gigant po raz pierwszy zaprezentował dwa autorskie modele sztucznej inteligencji, które mają być wykorzystywane do komunikacji głosowej.

Pierwszym z nich jest MAI-Voice-1. To zaawansowany system generowania mowy, który już teraz działa w funkcjach Copilot Daily i Podcasts. Model pozwala na błyskawiczne przekształcanie tekstu w ekspresyjny głos, z możliwością wyboru stylu i tonu wypowiedzi. Co istotne, generowanie minuty dźwięku trwa mniej niż sekundę i odbywa się na pojedynczym GPU, co czyni MAI-Voice-1 jednym z najbardziej wydajnych systemów tego typu.

Nowy model ma pełnić rolę interfejsu przyszłości w kontaktach człowieka ze sztuczną inteligencją. MAI-Voice-1 potrafi oddać emocje, imitować dialogi wielu postaci i reagować z dużą swobodą językową. Microsoft poinformował także, że udostępnił dedykowaną przestrzeń testową w Copilot Labs, gdzie każdy użytkownik może samodzielnie sprawdzić możliwości modelu, tworząc na przykład interaktywne opowieści. Możecie sami spróbować tutaj.

Wprowadzenie MAI-Voice-1 ma z jednej strony zwiększyć możliwości Copilota jako osobistego asystenta, a z drugiej zademonstrować, że Microsoft jest w stanie samodzielnie budować rozwiązania, które dotąd dostarczał głównie OpenAI. Model będzie dalej rozwijany, a jego funkcje mają pojawić się także w kolejnych usługach i aplikacjach firmy.

MAI-1-preview – czym zajmuje się ten model?

W przeciwieństwie do MAI-Voice-1, MAI-1-preview odpowiada za przetwarzanie tekstu, rozumienie instrukcji i generowanie odpowiedzi. Jest to konstrukcja typu mixture-of-experts (to jedna z technik uczenia maszynowego), trenowana na około 15000 GPU NVIDIA H100. Model został udostępniony do testów na platformie LMArena.

Microsoft zaznacza, że MAI-1-preview nie zastępuje modeli OpenAI w ramach Copilota, lecz stanowi uzupełnienie istniejącego ekosystemu. Firma zamierza stosować rozwiązania własne, partnerskie i open-source’owe w zależności od konkretnego zastosowania i oczekiwań użytkowników. Model MAI-1-preview będzie sukcesywnie wdrażany w wybranych funkcjach tekstowych Copilota, a także dostępny dla deweloperów poprzez interfejs API.

Choć Microsoft nie ogłosił jeszcze pełnego zakresu możliwości MAI-1, zaznaczył, że nadrzędnym celem jest stworzenie zróżnicowanego portfolio wyspecjalizowanych modeli, które wspólnie będą odpowiadać na różne potrzeby użytkowników.

Gigant dotąd w dużej mierze opierał się na współpracy z OpenAI, a teraz jak widać buduje alternatywne zaplecze, które ma zapewnić jej większą niezależność.

Zobacz również

Obserwuj nas