ITCOW牛新网 11月7日消息,月之暗面公司于11月6日晚间发布了其最新一代开源思考模型——Kimi K2 Thinking。该模型基于”模型即智能体”理念开发,具备原生支持”边思考边使用工具”的能力,在多项基准测试中表现卓越,被官方称为当前能力最强的开源思考模型。

据了解,Kimi K2 Thinking在多个权威评测中取得了领先成绩。在”人类最后的考试”这一涵盖100多个专业领域的综合性学术测试中,该模型在允许使用搜索、Python和网络浏览工具的条件下,获得了44.9%的SOTA成绩。此外,在OpenAI推出的BrowseComp基准测试中,Kimi K2 Thinking以60.2%的得分刷新了记录,远超人类平均29.2%的水平。


据ITCOW牛新网了解,该模型具备高度自主的任务处理能力,无需人工干预即可完成多达300轮的工具调用和多轮思考循环。通过”思考→搜索→浏览→编程”的动态流程,模型能够对复杂问题进行分解、假设验证和逻辑推理。在功能方面,Kimi K2 Thinking在编程、写作与研究等多个领域均有显著提升,其编码能力在多语言软件工程基准测试中进一步优化,创意写作方面能够将初步灵感转化为结构清晰的文本。
业内分析认为,Kimi K2 Thinking的发布标志着开源思考模型在自主推理和工具使用能力方面取得了重要突破。随着模型在Hugging Face和ModelScope等平台的开放部署,预计将推动AI智能体技术在学术研究和实际应用中的进一步发展。该模型在回应个人或情感类问题时也表现出更强的共情能力,能够提供细致、可行的建议。