3 artykuły z tym tagiem
Strukturalna ścieżka nauki budowania agentów voice AI, od pierwszego STT po skalowanie telefoniczne. LiveKit Agents i Pipecat jako najlepsze open-source opcje.
Nowy system text-to-speech od Google oferuje zaawansowaną kontrolę stylu mowy i konkurencyjne ceny przy wysokiej jakości dźwięku.
Nowy model text-to-speech z tagami audio pozwala na dokładne sterowanie stylem głosu w ponad 70 językach.