xAI发布Grok 4.1大模型，登顶LMArena排行榜，实现33位到第1位的性能跃升

11 月 18, 2025 #Grok, #Grok 4.1, #xAI

ITCOW牛新网 11月18日消息，埃隆・马斯克旗下的人工智能公司xAI于北京时间今日凌晨发布了新一代大语言模型Grok 4.1，并已面向grok、𝕏平台及移动应用(iOS和安卓)的所有用户全面推送。新模型在性能上实现重大突破，在LMArena大型语言模型竞技场的文本能力排行榜中，从之前的第33位跃升至第1位。

据了解，Grok 4.1的深度思考版本(代号quasarflux)以1483的Elo分数高居榜首，领先第二名达31分。其无需深度思考的”即时响应”版本也以1465的Elo分数位列第二，性能甚至超越了其他所有模型的”全推理”模式。这一成绩相较于前代Grok 4(排名第33位)实现了巨大飞跃。

除了在通用能力基准测试中表现出色，Grok 4.1在”软实力”方面也取得显著进步。在衡量模型情商的EQ-Bench3基准测试和评估创意能力的Creative Writing v3测试中，新模型均表现优异。在EQ-Bench3情感理解能力评测中，Grok 4.1的推理与非推理模式包揽了榜单前两名；在创意写作评估中，两种模式分别位列第二和第三。

另一项关键改进在于大幅降低了模型的”幻觉”率。xAI在Grok 4.1的训练后期，特别针对优化信息查询类提示，专注于减少事实性错误。根据对真实世界查询样本的评估，新模型的幻觉率已显著降低，从而为用户提供更可靠、更准确的信息。

人工智能

xAI发布Grok 4.1大模型，登顶LMArena排行榜，实现33位到第1位的性能跃升

相关文章

Figma携手Codex实现设计与代码双向同步推出全新MCP服务器

中国开源AI模型全球Token使用量登顶国际需求激增终结美国主导地位

谷歌发布Nano Banana 2图像模型：修复中文乱码，支持4K输出与角色一致性

更多资讯

网络餐饮新规6月1日实施 “幽灵外卖”将被强制标识

石头科技2025年营收增长55.85% 净利润因战略投入下降31.19%

影石Insta360在美专利战大获全胜 ITC终裁认定GoPro六项指控全部不成立

豆包手机助手严正声明：网传“漏洞”系黑公关炒作，已升级防护并保留追责权