ITCOW牛新网 2月3日消息,小米集团创始人兼CEO雷军今日宣布,公司研发团队的多项人工智能研究成果成功入选国际顶级学术会议ICLR 2026。这些成果覆盖多模态推理、强化学习、图形界面智能体、端到端自动驾驶及音频生成等关键方向,显示出小米在前沿技术领域的持续创新能力。

小米多项AI研究成果入选ICLR 2026

在强化学习框架优化方面,小米团队提出Shuffle-R1新型架构,通过成对轨迹采样与基于优势的批次重排序技术,有效解决了多模态大模型训练中的梯度信号不足问题。移动智能体研究则推出MobileIPL框架,引入思维级偏好优化机制,显著提升了图形界面智能体在复杂交互场景中的决策稳定性。针对轻量化模型部署需求,FutureMind方案通过自适应知识蒸馏技术,为小参数模型注入战略性思维模式,在不增加计算负担的前提下提升推理能力。

据ITCOW牛新网了解,在多模态技术融合领域,ThinkOmni框架创新性地将成熟文本推理能力迁移至全模态场景,通过引导解码实现感知与推理的协同优化。评测体系方面,团队构建的SMAN-Bench跨系统基准为移动智能体提供了涵盖单路径/多路径、模糊任务及噪声环境的标准化评估平台。音频生成技术Flow2GAN融合流匹配与生成对抗网络优势,在保证音质的同时大幅降低生成步数。自动驾驶方向提出的ReCogDrive框架首次将强化学习与认知模型结合,在多个仿真测试平台上取得领先性能。

在内容生成与重建领域,WorldSplat框架实现了驾驶场景的高效4D重建,而Dream4Drive方案则探索了合成数据在感知任务中的新范式。决策优化算法DIPOLE通过二分策略设计,为扩散模型在决策任务中的应用提供了新思路。这些系统性突破体现了小米在人工智能基础研究方面的深厚积累,为智能终端、自动驾驶等业务方向提供了坚实的技术支撑。