ITCOW牛新网 4月24日消息,OpenAI 今日正式发布新一代大模型 GPT-5.5,该模型被官方定义为目前“最智能、最直观”的版本。此次升级的核心在于智能体(Agent)能力的实质性飞跃,模型在自主规划、代码生成及复杂任务执行方面表现出了显著更强的能力。

GPT-5.5 在多项基准测试中刷新了纪录。在终端操作基准 Terminal-Bench 2.0 上,其准确率达到 82.7%;在针对真实 GitHub 问题的 SWE-Bench Pro 测试中,解决率高达 58.6%。尤为引人注目的是,该模型甚至在 Ramsey Numbers 等数学证明及生物信息学领域展现了辅助科研推理的潜力。OpenAI 透露,其内部超过 85% 的员工已每周使用该模型的代码功能,英伟达(NVIDIA)等合作伙伴也反馈其能将复杂调试时间从数天缩短至数小时。


在性能提升的同时,GPT-5.5 还实现了成本优化。尽管模型规模更大,但其延迟与 GPT-5.4 持平,且完成相同任务所需的 Token 数量大幅减少。在 Artificial Analysis 的 Coding Index 评估中,它以竞争模型约一半的成本提供了顶尖的智能水平。该模型现已在英伟达 GB200 NVL72 机架级系统上运行,得益于新硬件的加持,其百万 Token 成本较前代系统降低了 97%(降至 1/35),每兆瓦 Token 输出量提升了 50 倍。

目前,GPT-5.5 的标准版本已向 ChatGPT Plus 和 Pro 用户开放,API 版本即将推出。其定价策略极具竞争力,标准版输入价格为 5 美元/百万 Token,Pro 版本为 30 美元/百万 Token。