谷歌发布Gemini 3人工智能模型，多模态推理能力实现质的飞跃

ITCOW牛新网 11月19日消息，谷歌于当地时间11月18日正式推出其最新一代人工智能模型Gemini 3，该模型在推理、多模态处理和代码生成等方面实现显著提升，并首次在发布当天就整合到谷歌搜索、Gemini应用等核心产品中。

Alphabet首席执行官桑达尔·皮查伊强调，Gemini 3能够以更少的用户提示提供更精准的答案，尤其在处理复杂问题时表现突出。新模型还增强了图像生成、编程和应用开发功能，并已面向部分订阅用户开放，未来几周将扩大覆盖范围。此次发布距Gemini 2.5推出仅八个月，显示出谷歌在激烈AI竞争中的快速迭代能力。

据ITCOW牛新网了解，Gemini 3在多项行业基准测试中刷新纪录。例如，在全球LMArena排行榜上以1501分的成绩位居榜首，并在Humanity’s Last Exam推理测试中获得37.5%的高分，超越此前由GPT-5 Pro保持的31.64%。此外，该模型在数学、多模态理解和事实准确性等维度也设立新标准，被DeepMind CEO Demis Hassabis称为“全球最佳多模态理解模型”。

在推理能力方面，Gemini 3展现出博士级水平，在GPQA Diamond测试中取得91.9%的得分，并在多模态推理评估MMMU-Pro和Video-MMMU中分别达到81%和87.6%。谷歌还推出了Deep Think增强模式，该模式在ARC-AGI-2测试中创下45.1%的突破性成绩，目前正进行安全评估，计划向Ultra订阅用户开放。

开发者工具方面，Gemini 3在代码生成和智能体能力上大幅升级。其在WebDev Arena排行榜中以1487分领先，并通过Terminal-Bench 2.0等测试验证了终端操作能力。谷歌同步推出全新平台Google Antigravity，旨在将AI辅助升级为开发者的主动协作伙伴，支持在编辑器、终端等环境中无缝工作。

多模态功能上，Gemini 3延续了系列模型的跨模态处理优势，可整合文本、图像、音频等数据，并具备100万token的上下文窗口。实际应用场景包括翻译手写食谱、生成学习材料或分析运动视频以制定训练计划。智能体能力方面，该模型在Vending-Bench 2测试中展现长期规划稳定性，能高效处理多步骤任务如服务预订或邮件整理。

产品整合策略上，谷歌首次实现新模型发布即上线搜索产品，AI Mode现采用Gemini 3支持沉浸式视觉布局和交互工具。安全性方面，谷歌称该模型历经最全面评估，在防提示注入和抗网络攻击方面表现优异，并获第三方机构独立验证。目前Gemini应用月活用户达6.5亿，而AI Overviews拥有20亿用户，与OpenAI ChatGPT的7亿周活形成竞争态势。

谷歌发布Gemini 3人工智能模型，多模态推理能力实现质的飞跃

相关文章

Figma携手Codex实现设计与代码双向同步推出全新MCP服务器

中国开源AI模型全球Token使用量登顶国际需求激增终结美国主导地位

谷歌发布Nano Banana 2图像模型：修复中文乱码，支持4K输出与角色一致性

更多资讯

网络餐饮新规6月1日实施 “幽灵外卖”将被强制标识

石头科技2025年营收增长55.85% 净利润因战略投入下降31.19%

影石Insta360在美专利战大获全胜 ITC终裁认定GoPro六项指控全部不成立

豆包手机助手严正声明：网传“漏洞”系黑公关炒作，已升级防护并保留追责权