Startup Miry Murati pracuje nad modelem interakcji, który może jednocześnie słuchać i mówić jak w naturalnej rozmowie, z czasem odpowiedzi 0,40 sekundy.

Źródło zdjęcia: TechCrunch
Thinking Machines Lab, startup założony przez byłą CTO OpenAI Mirę Murati, ogłosił przełomową technologię zwaną „modelami interakcji”. Firma pracuje nad sztuczną inteligencją, która może słuchać i mówić jednocześnie, naśladując naturalną rozmowę telefoniczną zamiast wymiany wiadomości tekstowych. Szczegóły projektu opisuje TechCrunch.
Najnowsze modele Claude osiągają perfekcyjny wynik w testach bezpieczeństwa. Kluczem okazało się uczenie AI dlaczego pewne działania są właściwe.

Tom Steyer proponuje rewolucyjny plan finansowany podatkiem od firm technologicznych, który ma chronić pracowników przed skutkami automatyzacji AI.
Dotychczas wszystkie modele AI działały według tego samego schematu: użytkownik mówi, AI słucha, następnie AI odpowiada, a użytkownik słucha. Thinking Machines Lab próbuje całkowicie zmienić ten paradygmat, budując model który może przetworzyć input użytkownika i wygenerować odpowiedź w tym samym czasie.
Techniczne określenie tej funkcjonalności to „full duplex” — pojęcie znane z telekomunikacji, oznaczające możliwość jednoczesnego przesyłania danych w obu kierunkach. W praktyce oznacza to, że AI może przerwać użytkownikowi, podobnie jak to dzieje się w naturalnej rozmowie między ludźmi.
Firma twierdzi, że jej model TML-Interaction-Small osiąga czas odpowiedzi na poziomie 0,40 sekundy. To znacząco szybciej niż porównywalne modele od OpenAI czy Google, a jednocześnie odpowiada naturalnej prędkości ludzkiej konwersacji.
Jednak na razie to tylko zapowiedź. Thinking Machines Lab nie udostępnia jeszcze swojego rozwiązania publicznie. Ograniczony podgląd badawczy ma być dostępny w nadchodzących miesiącach, natomiast szersze wydanie zaplanowano na później w tym roku.
Choć benchmarki wyglądają imponująco, a sama idea — że interaktywność powinna być wbudowana w model, a nie doklejana jako dodatek — brzmi interesująco, rzeczywiste doświadczenie użytkowania pozostaje nieznane. Dopiero gdy ludzie będą mogli faktycznie przetestować technologię, okaże się, czy spełni ona swoje techniczne obietnice.