ITCOW牛新网 11月19日消息,谷歌于当地时间11月18日正式推出其最新一代人工智能模型Gemini 3,该模型在推理、多模态处理和代码生成等方面实现显著提升,并首次在发布当天就整合到谷歌搜索、Gemini应用等核心产品中。

Alphabet首席执行官桑达尔·皮查伊强调,Gemini 3能够以更少的用户提示提供更精准的答案,尤其在处理复杂问题时表现突出。新模型还增强了图像生成、编程和应用开发功能,并已面向部分订阅用户开放,未来几周将扩大覆盖范围。此次发布距Gemini 2.5推出仅八个月,显示出谷歌在激烈AI竞争中的快速迭代能力。
据ITCOW牛新网了解,Gemini 3在多项行业基准测试中刷新纪录。例如,在全球LMArena排行榜上以1501分的成绩位居榜首,并在Humanity’s Last Exam推理测试中获得37.5%的高分,超越此前由GPT-5 Pro保持的31.64%。此外,该模型在数学、多模态理解和事实准确性等维度也设立新标准,被DeepMind CEO Demis Hassabis称为“全球最佳多模态理解模型”。

在推理能力方面,Gemini 3展现出博士级水平,在GPQA Diamond测试中取得91.9%的得分,并在多模态推理评估MMMU-Pro和Video-MMMU中分别达到81%和87.6%。谷歌还推出了Deep Think增强模式,该模式在ARC-AGI-2测试中创下45.1%的突破性成绩,目前正进行安全评估,计划向Ultra订阅用户开放。

开发者工具方面,Gemini 3在代码生成和智能体能力上大幅升级。其在WebDev Arena排行榜中以1487分领先,并通过Terminal-Bench 2.0等测试验证了终端操作能力。谷歌同步推出全新平台Google Antigravity,旨在将AI辅助升级为开发者的主动协作伙伴,支持在编辑器、终端等环境中无缝工作。
多模态功能上,Gemini 3延续了系列模型的跨模态处理优势,可整合文本、图像、音频等数据,并具备100万token的上下文窗口。实际应用场景包括翻译手写食谱、生成学习材料或分析运动视频以制定训练计划。智能体能力方面,该模型在Vending-Bench 2测试中展现长期规划稳定性,能高效处理多步骤任务如服务预订或邮件整理。
产品整合策略上,谷歌首次实现新模型发布即上线搜索产品,AI Mode现采用Gemini 3支持沉浸式视觉布局和交互工具。安全性方面,谷歌称该模型历经最全面评估,在防提示注入和抗网络攻击方面表现优异,并获第三方机构独立验证。目前Gemini应用月活用户达6.5亿,而AI Overviews拥有20亿用户,与OpenAI ChatGPT的7亿周活形成竞争态势。