Anthropic 推出 Claude Opus 4.8：主打“诚实”与编程效能，快速模式提速2.5倍

ITCOW牛新网 5月29日消息，Anthropic 今日正式发布了其旗舰大语言模型的最新迭代版本——Claude Opus 4.8。此次更新并未单纯追求参数规模的扩张，而是将重心放在了提升模型在复杂智能体任务中的可靠性、代码生成的准确性以及输出的“诚实度”上。官方强调，Opus 4.8 在处理多步骤复杂任务时表现得更加稳健，具备更强的主动纠错能力，能够在发现计划不合理时提出异议，而非盲目执行。

据ITCOW牛新网了解，Opus 4.8 在多项权威基准测试中展现了强劲的竞争力。在软件工程基准测试 SWE-Bench Pro 中，该模型取得了 69.2% 的得分，成功超越了其竞争对手 GPT-5.5 和 Gemini 3.1 Pro。特别是在代码缺陷识别和复杂逻辑推理方面，新模型表现出更高的敏锐度。不过，在特定的终端编程基准测试中，GPT-5.5 依然保持着微弱的优势。除了性能的提升，Anthropic 还特别优化了模型的“对齐”表现，Opus 4.8 在支持用户自主性和维护用户利益等亲社会指标上创下新高，同时大幅减少了欺骗性输出，其表现已接近此前备受好评的 Claude Mythos Preview 模型。

在用户体验与定价策略方面，Anthropic 带来了颇具诚意的调整。Opus 4.8 引入了全新的“Effort 程度控制”功能，允许用户根据任务难度在 claude.ai 界面中手动平衡回复质量与响应速度。默认开启的“High”档位在编码任务中能提供优于前代的体验，而追求极致结果的专业用户则可以选择消耗更多算力资源的“Max”档位。

更为关键的是，新模型的快速模式（Fast Mode）推理速度提升至原来的 2.5 倍，而成本却降至此前模型的 1/3。具体定价上，常规模式维持每百万输入令牌 5 美元、输出 25 美元不变；快速模式则定为输入 10 美元、输出 50 美元。这一“加量减价”的策略无疑将降低开发者部署高性能 AI 应用的门槛，进一步推动智能体编程的普及。

Anthropic 推出 Claude Opus 4.8：主打“诚实”与编程效能，快速模式提速2.5倍

相关文章

1Password for Claude 上线：AI 交互场景下用户无需手动填密码

月之暗面发布 Kimi K3 旗舰大模型：2.8 万亿参数百万上下文登顶前端代码榜

世界人工智能合作组织协定签署落地上海，王毅代表中方签字，二十九国成创始成员

更多资讯

以热爱立业，这群“小镇青年”创业者正在集结！

三星承认 Galaxy S26 Ultra 屏幕局部发红非硬件故障，已推软件补丁优化色彩校正

商务部就英方将敬业集团旗下英国钢铁公司国有化表态，坚决反对并敦促公平对待中资企业

京东宣布年投超百亿为全职骑手快递员缴五险一金，15万外卖员全员直签劳动合同