OpenAI发布旗舰图像生成模型GPT Image 1.5，生成速度提升4倍，指令遵循能力大幅增强

ITCOW牛新网 12月17日消息，北京时间12月17日凌晨，OpenAI正式推出全新旗舰图像生成模型GPT Image 1.5，并将其集成至ChatGPT平台。该模型在指令遵循、编辑精度和生成速度方面均有突破，标志着OpenAI图像生成能力从”新奇体验”向”实用工具”的战略转型。

GPT Image 1.5最突出的改进体现在多轮编辑的一致性保持能力上。新模型能够更准确地区分”需要改变的部分”与”应当保持不变的部分”，在局部修改时完美保留光线、构图、人物外观等关键特征，有效解决了以往AI改图”改一处、乱一片”的痛点。这一能力使模型在功能性照片微调、服装试穿、风格转换等场景中表现更加稳定可靠。

在性能方面，新模型生成速度最高提升至上一代的4倍，显著缩短了等待时间。同时，API输入输出成本较上一代降低约20%，为商业场景的规模化应用提供了条件。模型在文本渲染能力上也有显著提升，能够更清晰地呈现密集文本与小字号内容，在信息图、海报设计等实用场景中表现优异。

OpenAI在ChatGPT中新增了独立的”Images”标签页，内置多种预设滤镜和热门提示词，为用户提供更集中的创作空间。这一设计将图像生成与编辑从对话窗口的附属功能升级为独立的创作环境，支持连续创作、反复修改和结果管理。用户还可以一次性上传个人形象，用于后续重复创作，减少重复拍摄或上传的成本。

此次发布罕见公开了项目背后的庞大研发团队名单。项目由Gabriel Goh担任研发负责人，Adele Li担任产品负责人。值得注意的是，Sora负责人Bill Peebles和DALL-E系列缔造者Aditya Ramesh也出现在领导层名单中，强烈暗示新版图像功能可能在底层架构上借鉴了Sora的”世界模拟”技术，或是在为未来图像与视频生成的无缝切换做技术铺垫。

此次发布正值人工智能实验室之间图像生成竞争日趋激烈之际。在谷歌Nano Banana获得“病毒式传播”成功之后，OpenAI加速推出新模型以应对竞争。评测机构Artificial Analysis指出，GPT Image 1.5在文本转图像和图像编辑方面均位列第一，超过Nano Banana Pro，指令遵守率高达90%，断层式领先。不过，在更强调精细化图像编辑能力的GenAI Image Editing Showdown中，GPT Image 1.5仍未能反超谷歌。

OpenAI此次投入了规模庞大的”安全、诚信与策略”团队，由20余名专家组成，专门负责制定内容过滤机制、防止恶意滥用以及确保生成内容的合规性。这种”科研+工程+产品+安全”的矩阵式团队结构，展示了OpenAI将前沿技术转化为成熟消费级产品的强大组织能力。

GPT Image 1.5已面向全球所有ChatGPT用户和API用户开放，免费用户也可以使用。此次更新标志着OpenAI图像生成能力从”创意娱乐”向”实用专业工具”的转型，未来将继续在精细编辑、视觉一致性以及多语言支持等方向持续优化。

OpenAI发布旗舰图像生成模型GPT Image 1.5，生成速度提升4倍，指令遵循能力大幅增强

相关文章

Cursor发布Composer 2编程模型：主打长周期智能体编程，价格降幅达86%

微软MAI-Image-2大模型跃居全球生图三强，攻克文字渲染痛点

通义千问旗舰预览版亮相LM Arena，阿里跻身全球大模型公司前五

更多资讯

Cursor发布Composer 2编程模型：主打长周期智能体编程，价格降幅达86%

雷军致谢王兴兴：谢谢你在五年前给了我们一个投资宇树科技的机会

编造传播科大讯飞“裁员30%”网络谣言，造谣者沙某被行政拘留

微软MAI-Image-2大模型跃居全球生图三强，攻克文字渲染痛点