谷歌发布Gemini 3.1 Flash-Lite：成本仅Pro版1/8，AI推理进入“丰俭由人”时代

3 月 4, 2026 #Gemini, #Gemini 3, #谷歌

ITCOW牛新网 3月4日消息，谷歌DeepMind于3月3日推出轻量级AI模型Gemini 3.1 Flash-Lite。该模型主打极致的成本效益与响应速度，输入价格低至每百万Token 0.25美元，仅为Pro版本的八分之一，同时首字响应速度较前代提升2.5倍，旨在为大规模AI应用提供“又快又省”的解决方案。

据ITCOW牛新网了解，Gemini 3.1 Flash-Lite在性能上并未因低价而妥协。在权威评测平台Arena.ai的排行榜中，该模型斩获了1432分的Elo得分，并在GPQA Diamond科学知识测试中取得86.9%的高分，甚至在多项指标上超越了体积更大的上一代Gemini 2.5 Flash模型。这种“小身材大能量”的特性，使其成为构建实时交互应用（如实时翻译、直播弹幕审核）的理想选择。

此次发布最引人注目的创新是引入了“思考层级”（Thinking Levels）功能。开发者可根据任务复杂度动态调节模型的推理深度：对于海量翻译、内容审核等高频低耗任务，可调低思考层级以追求极致效率；而在生成用户界面、构建数据看板等高难度任务时，则可调高思考层级，激发模型更深度的推理能力。这种“丰俭由人”的机制，让企业能够像调节水龙头一样精准控制AI的成本与性能。

目前，该模型已通过Google AI Studio的Gemini API向开发者开放预览，企业级用户也可在Vertex AI平台上同步体验。Latitude、Cartwheel等早期测试企业反馈，该模型在复杂指令遵循与大规模处理方面表现稳定，成功实现了成本与性能的平衡。

人工智能

谷歌发布Gemini 3.1 Flash-Lite：成本仅Pro版1/8，AI推理进入“丰俭由人”时代

相关文章

Claude Code 语音模式上线：编程进入“动口不动手”时代，空格键成新交互核心

阿里QoderWork桌面Agent全面开放：双平台适配，新增模型分级与沙盒环境

美国财政部等机构全面停用Anthropic产品，转向OpenAI技术

更多资讯

比亚迪3月5日发布第二代刀片电池，仰望U7首发搭载续航破千公里

微软Build 2026定档6月：重返旧金山，聚焦AI核心与深度互动

华为鸿蒙智选品牌正式开启官方账号

Claude Code 语音模式上线：编程进入“动口不动手”时代，空格键成新交互核心