Nowa funkcja Custom Voices od xAI pozwala stworzyć klon głosu w mniej niż dwie minuty na podstawie minutowego nagrania. Firma wdrożyła zabezpieczenia.

Źródło zdjęcia: The Decoder
Firma xAI Elona Muska uruchomiła nową funkcję o nazwie „Custom Voices”, która pozwala użytkownikom sklonować własny głos na podstawie zaledwie minutowego nagrania. Funkcja jest dostępna przez konsolę xAI i według deklaracji firmy, model głosu jest gotowy w mniej niż dwie minuty, jak donosi The Decoder.

Nowy domyślny model ChatGPT ma generować o ponad połowę mniej fałszywych informacji w obszarach wysokiego ryzyka jak medycyna i prawo.

NVIDIA i ServiceNow ogłaszają Project Arc — długoterminowego agenta desktopowego z OpenShell, oferującego 35x niższe koszty tokenów dzięki platformie Blackwell.
Sklonowany głos można następnie wykorzystać w interfejsach API firmy do syntezy mowy i agentów głosowych. xAI wprowadził również zabezpieczenia mające zapobiec nadużyciom technologii.
xAI zastosował dwuetapowy proces weryfikacji, mający zapobiec klonowaniu głosów bez zgody właściciela. Pierwszy krok polega na odczytaniu przez użytkownika passphrase, które jest sprawdzane w czasie rzeczywistym. W drugim etapie system porównuje charakterystyki głosu z obu nagrań, aby potwierdzić, że mówi ta sama osoba.
Według xAI, taki system uniemożliwia klonowanie istniejących nagrań lub głosu kogoś innego. To ważne zabezpieczenie w kontekście rosnących obaw związanych z potencjalnym nadużywaniem technologii klonowania głosu.
Nowa funkcja „Custom Voices” wpisuje się w szerszą strategię xAI dotyczącą technologii głosowych. Bazuje ona na niedawno uruchomionych API Grok Speech-to-Text i Text-to-Speech oraz modelu agenta głosowego „Grok Voice Think Fast 1.0”, który według firmy już obsługuje wsparcie klienta i sprzedaż dla Starlink.
Konsola xAI została również wzbogacona o „Bibliotekę głosów” zawierającą ponad 80 preinstalowanych głosów w 28 językach. Co istotne, korzystanie ze sklonowanych głosów nie pociąga za sobą dodatkowych kosztów, co może przyczynić się do szerszego adopcji tej technologii.
Wprowadzenie funkcji Custom Voices przez xAI stanowi kolejny krok w rozwoju technologii klonowania głosu, łącząc prostotę użycia z zabezpieczeniami mającymi zapobiec nadużyciom.