ITCOW牛新网 12月7日消息,腾讯近日推出了全新一代自研AI大模型混元2.0,该模型包含推理版和指令版两大核心模块,采用混合专家架构,总参数量达到4060亿,激活参数320亿,支持256K超长上下文窗口。这款新模型在复杂推理、文本创作及多轮交互等关键场景中展现出国内顶尖的AI推理能力。

相比前代产品,混元2.0在预训练数据和强化学习策略方面进行了深度优化,特别是在数学、科学、代码及指令遵循等高难度推理任务中表现卓越。在数学与科学推理领域,腾讯采用高质量数据结合Large Rollout强化学习方法,使模型在国际数学奥林匹克竞赛和哈佛MIT数学竞赛等权威测试中达到顶尖水平。
同时,在HLE和ARC AGI等极端知识与泛化能力测试中,模型表现获得显著提升。模型通过重要性采样修正解决了训练与推理不一致的问题,并采用长窗口RL稳定训练,结合多样化任务沙盒和打分准则强化学习,在复杂指令任务中表现优化。

腾讯还构建了大规模可验证环境配合高质量合成数据,大幅提升模型在智能编码及复杂工具调用场景的实用性,在真实应用测试中表现跃升。
混元2.0引入精细化长度惩罚策略,优化思维链效率,避免冗余输出,使计算资源分配更合理。在四大权威推理任务中,该模型在相近准确率下消耗更少Tokens,单位Token智能密度达到行业领先水平。基于双阶段强化学习,模型的输出质量显著提升,在文本创作、前端开发、指令遵循等实用场景中展现独特优势。

腾讯表示,混元2.0仍将持续进化,未来将重点优化代码能力、智能体交互、个性化风格及长程记忆,并计划通过开源方式向开发者社区开放部分技术。
目前,该模型已率先接入腾讯元宝、ima等原生AI应用,并在腾讯云上线API,开发者及企业用户可直接体验或集成部署,加速AI应用落地。
