Microsoft ogłosił opracowanie własnych głosowych modeli AI. To MAI-Voice-1 oraz MAI-1-preview. To pierwszy tak wyraźny krok w stronę uniezależnienia się od OpenAI i stworzenia własnej podstawy technologicznej w tym zakresie.
Jak dobrze mówi nowy model AI Microsoftu?
Microsoft do tej pory korzystał z integracji modeli OpenAI w ramach usługi Azure i Copilota. Teraz jednak gigant po raz pierwszy zaprezentował dwa autorskie modele sztucznej inteligencji, które mają być wykorzystywane do komunikacji głosowej.
Pierwszym z nich jest MAI-Voice-1. To zaawansowany system generowania mowy, który już teraz działa w funkcjach Copilot Daily i Podcasts. Model pozwala na błyskawiczne przekształcanie tekstu w ekspresyjny głos, z możliwością wyboru stylu i tonu wypowiedzi. Co istotne, generowanie minuty dźwięku trwa mniej niż sekundę i odbywa się na pojedynczym GPU, co czyni MAI-Voice-1 jednym z najbardziej wydajnych systemów tego typu.
Nowy model ma pełnić rolę interfejsu przyszłości w kontaktach człowieka ze sztuczną inteligencją. MAI-Voice-1 potrafi oddać emocje, imitować dialogi wielu postaci i reagować z dużą swobodą językową. Microsoft poinformował także, że udostępnił dedykowaną przestrzeń testową w Copilot Labs, gdzie każdy użytkownik może samodzielnie sprawdzić możliwości modelu, tworząc na przykład interaktywne opowieści. Możecie sami spróbować tutaj.
Wprowadzenie MAI-Voice-1 ma z jednej strony zwiększyć możliwości Copilota jako osobistego asystenta, a z drugiej zademonstrować, że Microsoft jest w stanie samodzielnie budować rozwiązania, które dotąd dostarczał głównie OpenAI. Model będzie dalej rozwijany, a jego funkcje mają pojawić się także w kolejnych usługach i aplikacjach firmy.
MAI-1-preview – czym zajmuje się ten model?
W przeciwieństwie do MAI-Voice-1, MAI-1-preview odpowiada za przetwarzanie tekstu, rozumienie instrukcji i generowanie odpowiedzi. Jest to konstrukcja typu mixture-of-experts (to jedna z technik uczenia maszynowego), trenowana na około 15000 GPU NVIDIA H100. Model został udostępniony do testów na platformie LMArena.
Microsoft zaznacza, że MAI-1-preview nie zastępuje modeli OpenAI w ramach Copilota, lecz stanowi uzupełnienie istniejącego ekosystemu. Firma zamierza stosować rozwiązania własne, partnerskie i open-source’owe w zależności od konkretnego zastosowania i oczekiwań użytkowników. Model MAI-1-preview będzie sukcesywnie wdrażany w wybranych funkcjach tekstowych Copilota, a także dostępny dla deweloperów poprzez interfejs API.
Choć Microsoft nie ogłosił jeszcze pełnego zakresu możliwości MAI-1, zaznaczył, że nadrzędnym celem jest stworzenie zróżnicowanego portfolio wyspecjalizowanych modeli, które wspólnie będą odpowiadać na różne potrzeby użytkowników.
Gigant dotąd w dużej mierze opierał się na współpracy z OpenAI, a teraz jak widać buduje alternatywne zaplecze, które ma zapewnić jej większą niezależność.