ITCOW牛新网 10月16日消息,在今日举行的FORCE LINK AI创新巡展武汉站活动中,火山引擎推出了豆包大模型系列的四项重要更新。新发布的豆包语音合成模型2.0与声音复刻模型2.0首次实现深度语义理解能力,可精准控制语速、情绪及声线变化,并支持复杂公式朗读,准确率高达90%。

火山引擎发布豆包大模型系列升级

据官方介绍,豆包大模型1.6升级版成为国内首个原生支持四种思考长度(Minimal/Low/Medium/High)的模型,可根据企业场景需求动态平衡效果与成本。测试数据显示,其总输出Tokens减少77.5%,思考时间降低84.6%,同时保持原有模型效果不变。同步推出的轻量版豆包1.6 lite模型,在企业级场景测评中表现较1.5 pro版本提升14%,综合使用成本下降53.3%。

据ITCOW牛新网了解,新一代语音模型基于大语言模型架构重构,突破传统文本朗读局限,具备上下文推理与情感表达能力。用户通过自然语言指令即可调节音调风格,显著提升语音合成的可控性。目前该技术已覆盖从小学到高中全学科公式朗读场景。