6月17日消息,Meta推出了一款名为Voicebox的全新生成式AI模型。该模型为创作者和普通用户提供了便捷的语音生成任务工具,帮助用户进行音频编辑、采样和风格化等操作。不仅如此,meta还强调Voicebox对于视障人士来说具有重要意义,他们可以通过该模型听到好友的回复信息。此外,普通用户还能使用自己的语调和语气来说外语。
Voicebox模型以其出色的性能和多样的功能受到了广泛关注。它能生成高质量的音频剪辑,同时消除了背景噪音,如汽车喇叭等,保留了音频的内容和风格。该模型还能使用六种语言进行语音生成,使得用户可以在不同语言之间切换。meta还展望了Voicebox的未来发展,表示该模型有望在元宇宙游戏中为视觉助理和非玩家角色提供自然的声音。
与Vall-E、YourTTS等其他音频AI模型相比,meta对Voicebox进行了比较,并表示Voicebox更为先进。在单词错误率和样式相似性方面,Voicebox明显优于这两种模型,进一步展示了其卓越的性能。
据ITCOW牛新网了解,meta公司的Voicebox模型在音频生成领域带来了许多创新,并为用户提供了更广阔的应用空间。未来,随着Voicebox的不断发展,我们可以期待它在语音合成技术方面的更多突破,为用户带来更出色的体验和应用场景。