月之暗面发布Kimi K2 Thinking开源模型，多项基准测试刷新SOTA记录

ITCOW牛新网 11月7日消息，月之暗面公司于11月6日晚间发布了其最新一代开源思考模型——Kimi K2 Thinking。该模型基于”模型即智能体”理念开发，具备原生支持”边思考边使用工具”的能力，在多项基准测试中表现卓越，被官方称为当前能力最强的开源思考模型。

据了解，Kimi K2 Thinking在多个权威评测中取得了领先成绩。在”人类最后的考试”这一涵盖100多个专业领域的综合性学术测试中，该模型在允许使用搜索、Python和网络浏览工具的条件下，获得了44.9%的SOTA成绩。此外，在OpenAI推出的BrowseComp基准测试中，Kimi K2 Thinking以60.2%的得分刷新了记录，远超人类平均29.2%的水平。

据ITCOW牛新网了解，该模型具备高度自主的任务处理能力，无需人工干预即可完成多达300轮的工具调用和多轮思考循环。通过”思考→搜索→浏览→编程”的动态流程，模型能够对复杂问题进行分解、假设验证和逻辑推理。在功能方面，Kimi K2 Thinking在编程、写作与研究等多个领域均有显著提升，其编码能力在多语言软件工程基准测试中进一步优化，创意写作方面能够将初步灵感转化为结构清晰的文本。

业内分析认为，Kimi K2 Thinking的发布标志着开源思考模型在自主推理和工具使用能力方面取得了重要突破。随着模型在Hugging Face和ModelScope等平台的开放部署，预计将推动AI智能体技术在学术研究和实际应用中的进一步发展。该模型在回应个人或情感类问题时也表现出更强的共情能力，能够提供细致、可行的建议。

月之暗面发布Kimi K2 Thinking开源模型，多项基准测试刷新SOTA记录

相关文章

Anthropic封杀OpenClaw：订阅额度不再支持第三方工具

谷歌 AI Pro 订阅存储空间提至 5TB，功能生态再扩容

阿里发布 Qwen3.6-Plus 模型编码智能体能力跃升性价比领先同级别产品

更多资讯

途观L Pro新增入门版：搭载1.5T动力，21.38万元起

一汽丰田2026款亚洲龙星耀版上市：黑化外观，17.98万元起

小米物流大件“当日达”服务覆盖50城，上午下单当日必达

北京警方预警：iMessage“贷款逾期”诈骗频发，涉案金额已近27万元