ElevenLabs 发布了其文本转语音 (TTS) 模型 Eleven v3 的 alpha 版本。这个新版本在 AI 驱动的语音生成方面引入了重大进展。
Eleven v3 的一个关键特性是它支持日语,满足了长期以来的需求。此外,它还融入了情感和对话能力,使其与之前的模型区别开来。
Eleven v3 将语言支持从 33 种扩展到 70 多种,将全球人口覆盖率从 60% 提高到 90%。该模型还具有对话模式,用于自然的说话者过渡,以及语音标签支持,用于细致的表达。
用户现在可以添加诸如叹息和笑声之类的声音提示。该模型还支持在单个文本中表达多种情感。流媒体支持计划在不久的将来推出,目标是呼叫中心和实时对话代理。
提供免费试用,允许用户测试 Eleven v3 的功能。免费计划允许每月生成多达 20,000 个字符,每次生成最多 2,500 个字符。