ITCOW牛新网 12月10日消息,阿里巴巴今日正式推出通义千问Qwen3-TTS语音合成模型,该模型支持超过49种音色、10种语言及多种方言,目前已通过Qwen API开放使用。此次升级显著提升了语音合成的自然度与多样性,进一步拓展了AI语音的应用场景。

Qwen3-TTS在音色库中新增了多个风格鲜明的角色声线,包括撒娇搞怪风格的“茉兔”、青梅竹马型的“小野杏”、傲娇率性的“十三”等,覆盖不同年龄、性别和地域特征。模型在MiniMax TTS多语言测试集上的平均词错误率优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview等主流竞品。
据ITCOW牛新网了解,该模型对方言的支持实现重要突破,新增闽南语、吴语、粤语、四川话等9种方言生成能力,能够精准还原地方口音特色。在技术层面,Qwen3-TTS通过自适应韵律调节算法,大幅提升了语速和语调的自然度,拟人化程度接近真人水平。

目前,Qwen3-TTS已接入阿里巴巴旗下多款应用,未来将逐步开放给开发者和企业用户。行业分析认为,此类多语言、多方言语音合成技术的成熟,将加速智能助手、有声内容创作、跨语言服务等领域的创新应用落地。