ITCOW牛新网 6月17日消息,据科技媒体 testingcatalog 今日披露,OpenAI 公司目前正在筹备推出代号为 GPT-Bidi-1 的全新模型,这将是 ChatGPT 语音模式自上线以来规模最大的一次底层升级。该模型基于 OpenAI 今年初启动研发的”双向(BiDi)”架构打造,旨在彻底改变当前语音对话中”一问一答、不可打断”的刻板交互逻辑,让 AI 语音助手真正具备近似真人通话的自然感。

OpenAI 筹备推出 GPT-Bidi-1 模型:ChatGPT 语音模式或迎最大规模升级

据ITCOW牛新网了解,目前 ChatGPT 的高级语音模式仍基于较早期的音频技术栈,虽然支持语音输入与输出,但在多轮对话中的表现明显落后于文字版 GPT-5.5 模型的语言理解与推理能力,尤其是不支持用户在 AI 说话途中插话打断或实时引导话题走向。GPT-Bidi-1 的核心突破正是引入双向音频流处理——模型可同时”听”和”说”,能敏锐捕捉用户的插话意图并即时调整后续回复内容,而不需要等当前回答完整生成完毕后再重新识别新指令,从而大幅缩短感知延迟并消除尴尬的静默等待期。

OpenAI 筹备推出 GPT-Bidi-1 模型:ChatGPT 语音模式或迎最大规模升级

新模型上线后,用户可在设置中自由切换”双向模式”与现有的高级语音模式,并像文字对话一样选择 High(高深度)、Medium(均衡)及 Instant(极速响应)三种智能等级,根据任务复杂度灵活平衡推理质量与响应速度。虽然 OpenAI 尚未公布确切的公测时间,但业内普遍预期 GPT-Bidi-1 将于近期向 Plus 及以上订阅用户逐步开放测试,届时 ChatGPT 的语音交互体验有望首次追平并部分超越文字版的智能表现。