ITCOW牛新网 3月4日消息,谷歌DeepMind于3月3日推出轻量级AI模型Gemini 3.1 Flash-Lite。该模型主打极致的成本效益与响应速度,输入价格低至每百万Token 0.25美元,仅为Pro版本的八分之一,同时首字响应速度较前代提升2.5倍,旨在为大规模AI应用提供“又快又省”的解决方案。

Gemini 3.1 Flash-Lite

据ITCOW牛新网了解,Gemini 3.1 Flash-Lite在性能上并未因低价而妥协。在权威评测平台Arena.ai的排行榜中,该模型斩获了1432分的Elo得分,并在GPQA Diamond科学知识测试中取得86.9%的高分,甚至在多项指标上超越了体积更大的上一代Gemini 2.5 Flash模型。这种“小身材大能量”的特性,使其成为构建实时交互应用(如实时翻译、直播弹幕审核)的理想选择。

Gemini 3.1 Flash-Lite

此次发布最引人注目的创新是引入了“思考层级”(Thinking Levels)功能。开发者可根据任务复杂度动态调节模型的推理深度:对于海量翻译、内容审核等高频低耗任务,可调低思考层级以追求极致效率;而在生成用户界面、构建数据看板等高难度任务时,则可调高思考层级,激发模型更深度的推理能力。这种“丰俭由人”的机制,让企业能够像调节水龙头一样精准控制AI的成本与性能。

Gemini 3.1 Flash-Lite

目前,该模型已通过Google AI Studio的Gemini API向开发者开放预览,企业级用户也可在Vertex AI平台上同步体验。Latitude、Cartwheel等早期测试企业反馈,该模型在复杂指令遵循与大规模处理方面表现稳定,成功实现了成本与性能的平衡。