OpenAI 筹备推出 GPT-Bidi-1 模型：ChatGPT 语音模式或迎最大规模升级

ITCOW牛新网 6月17日消息，据科技媒体 testingcatalog 今日披露，OpenAI 公司目前正在筹备推出代号为 GPT-Bidi-1 的全新模型，这将是 ChatGPT 语音模式自上线以来规模最大的一次底层升级。该模型基于 OpenAI 今年初启动研发的”双向（BiDi）”架构打造，旨在彻底改变当前语音对话中”一问一答、不可打断”的刻板交互逻辑，让 AI 语音助手真正具备近似真人通话的自然感。

据ITCOW牛新网了解，目前 ChatGPT 的高级语音模式仍基于较早期的音频技术栈，虽然支持语音输入与输出，但在多轮对话中的表现明显落后于文字版 GPT-5.5 模型的语言理解与推理能力，尤其是不支持用户在 AI 说话途中插话打断或实时引导话题走向。GPT-Bidi-1 的核心突破正是引入双向音频流处理——模型可同时”听”和”说”，能敏锐捕捉用户的插话意图并即时调整后续回复内容，而不需要等当前回答完整生成完毕后再重新识别新指令，从而大幅缩短感知延迟并消除尴尬的静默等待期。

新模型上线后，用户可在设置中自由切换”双向模式”与现有的高级语音模式，并像文字对话一样选择 High（高深度）、Medium（均衡）及 Instant（极速响应）三种智能等级，根据任务复杂度灵活平衡推理质量与响应速度。虽然 OpenAI 尚未公布确切的公测时间，但业内普遍预期 GPT-Bidi-1 将于近期向 Plus 及以上订阅用户逐步开放测试，届时 ChatGPT 的语音交互体验有望首次追平并部分超越文字版的智能表现。

OpenAI 筹备推出 GPT-Bidi-1 模型：ChatGPT 语音模式或迎最大规模升级

相关文章

奥尔特曼国会山演示 OpenAI Astra 新模型：多智能体协同拆长周期任务

智谱 GLM Coding Plan 订阅回归：透明积分制每月 118 元起

微软 Microsoft Foundry 接入月之暗面 Kimi K3：需经 Fireworks AI 部署

更多资讯

比亚迪7月售车419211辆同比增21.76%，海外179841辆翻倍跳涨创纪录

吉利汽车7月销量250161辆创同期新高，新能源占比64%出口10.7万辆破单月纪录

WPS 正式版上线统一存储管理：缓存备份可迁出 C 盘、旧安装包一键清

蔚来7月交付35934台同比增71%，ES8单车型破万、萤火虫同比涨143.9%