ITCOW牛新网 2月8日消息,Claude近日针对其Opus 4.6模型发布了“快速模式”研究预览版功能。该功能通过调整API参数配置,在保持模型原有输出质量与完整功能的基础上,实现了响应延迟的显著降低。官方特别说明,此模式并非新模型,而是对现有架构的速度优先优化方案。

快速模式现已面向Pro、Team订阅用户及Console用户开放,采用“额外用量”独立计费方式,定价为每百万Token输入30美元、输出150美元。为推广新功能,Claude Code推出限时优惠,太平洋时间2月16日晚11:59前所有用户均可享受50%费用减免。不过,亚马逊Bedrock、谷歌Vertex AI及微软Azure Foundry等第三方云平台暂未接入此服务。
据ITCOW牛新网了解,Opus 4.6模型自身近期已完成多项升级。新版本将上下文窗口扩展至20万Token(测试版支持100万Token),最大输出Token数从6.4万提升至12.8万。模型引入自适应思考机制,可根据问题复杂度动态调整思考深度,并新增顶级推理资源参数。此外,当对话长度接近窗口限制时,系统会自动压缩早期对话内容,实现近乎无限长的连续对话能力。