ITCOW牛新网 2月13日消息,谷歌于今日宣布对Gemini 3 Deep Think推理模式进行升级。此次升级聚焦于科学、研究与工程领域的复杂问题求解,旨在应对真实科研环境中数据杂乱、边界模糊的挑战。升级后的模型在多项高难度基准测试中刷新纪录,并首次通过API向研究人员和企业开放早期访问。

据ITCOW牛新网了解,新版Deep Think在数学、算法与编程等高阶推理任务上表现突出。该模型在不借助外部工具的情况下,在“终极人类考试”中取得48.4%的成绩,在ARC-AGI-2测试中达到84.6%,并在Codeforces竞赛编程基准中获得3455的Elo评分,达到世界顶尖程序员水平。此外,模型在2025年国际数学、物理及化学奥林匹克竞赛中均达到金牌级表现。


在应用层面,谷歌展示了Deep Think在科研实践中的价值,包括帮助数学家发现论文中的逻辑漏洞、协助工程师优化半导体晶体生长工艺等。

目前,该模式已向Google AI Ultra订阅用户开放,并首次通过Gemini API向部分研究人员、工程师及企业提供早期访问权限。