Meta发布全新AI模型Voicebox，助力语音生成任务

6 月 17, 2023 #AI, #Meta

6月17日消息，Meta推出了一款名为Voicebox的全新生成式AI模型。该模型为创作者和普通用户提供了便捷的语音生成任务工具，帮助用户进行音频编辑、采样和风格化等操作。不仅如此，meta还强调Voicebox对于视障人士来说具有重要意义，他们可以通过该模型听到好友的回复信息。此外，普通用户还能使用自己的语调和语气来说外语。

Voicebox模型以其出色的性能和多样的功能受到了广泛关注。它能生成高质量的音频剪辑，同时消除了背景噪音，如汽车喇叭等，保留了音频的内容和风格。该模型还能使用六种语言进行语音生成，使得用户可以在不同语言之间切换。meta还展望了Voicebox的未来发展，表示该模型有望在元宇宙游戏中为视觉助理和非玩家角色提供自然的声音。

与Vall-E、YourTTS等其他音频AI模型相比，meta对Voicebox进行了比较，并表示Voicebox更为先进。在单词错误率和样式相似性方面，Voicebox明显优于这两种模型，进一步展示了其卓越的性能。

据ITCOW牛新网了解，meta公司的Voicebox模型在音频生成领域带来了许多创新，并为用户提供了更广阔的应用空间。未来，随着Voicebox的不断发展，我们可以期待它在语音合成技术方面的更多突破，为用户带来更出色的体验和应用场景。

人工智能头条关注

Meta发布全新AI模型Voicebox，助力语音生成任务

相关文章

Anthropic 发布 Claude Opus 5：性能逼近 Fable 5 但价格砍半

Anthropic 为 Claude 语音模式接入 Opus 与 Sonnet：支持 Gmail/Slack/Canva 语音调度

OpenAI 将 ChatGPT 语音功能推至 macOS/Windows 桌面端：GPT-Live 驱动开口调度 Codex 多代理

更多资讯

马斯克：计划全量开源特斯拉 Model S/X 设计与代码

微软将为 Windows KMS 批量激活引入 TPM 硬件证明机制

携程公布 19 项反垄断整改措施：下线特牌/金牌独家模式、退 1.22 亿储备金

奇瑞集团全球累计销量突破 2000 万辆，连续 23 年居中国品牌乘用车出口第一