ElevenLabs推Flash语音对话模型:仅75毫秒延迟 支持32种语言-文本歌词

ElevenLabs推Flash语音对话模型:仅75毫秒延迟 支持32种语言-文本歌词

发行日期:

本字幕由TME AI技术生成

elevenlives推出新人声合成模型flash为目前最快文本转语音方案

延迟仅七十五毫秒

分英语版及支持三十二种语言的版本

虽音质和情感表现稍次

但速度盲测最优