ITCOW牛新网 1月14日消息,面壁智能今日宣布,由清华大学自然语言处理实验室、中国人民大学、面壁智能与OpenBMB开源社区联合研发的AgentCPM-Explore智能体模型正式发布。该模型基于仅4B参数规模,在多项智能体评测基准中展现出卓越的参数效能比,为端侧设备部署大模型长程任务处理能力提供了新的技术路径。

面壁智能联合多机构推出AgentCPM-Explore模型

AgentCPM-Explore在GAIA、HLE、Browsercomp、WebWalker、FRAMES、Xbench-DeepResearch、Seal-0等八大智能体评测基准上均取得突破性表现。测试结果显示,该模型不仅实现了同尺寸模型的SOTA(最优性能)水平,更越级超越了两倍参数量(8B级)的SOTA模型,部分指标甚至达到了30B级以上模型及闭源大模型的效果。

面壁智能联合多机构推出AgentCPM-Explore模型

据ITCOW牛新网了解,在Xbench-DeepResearch专项测试中,AgentCPM-Explore的表现尤为突出,成功超越了OpenAI-o3、Claude-4.5-Sonnet等知名闭源大模型。

值得一提的是,研发团队宣布将AgentCPM-Explore模型全面开源,并同步公开了从Base模型(GAIA 25.24%)进化至SOTA模型(GAIA 63.90%)的全流程代码。这一举措将为学术界和产业界提供宝贵的技术参考,推动智能体技术的进一步发展。开源地址已在官方渠道公布,开发者可自由获取并使用相关资源。

此次发布的AgentCPM-Explore模型展现了小参数模型在大任务处理上的巨大潜力,为端侧AI应用开辟了新的可能性,预计将在移动设备、物联网等资源受限场景中发挥重要作用。