ITCOW牛新网 6月4日消息,OpenAI 于昨日发布博文,宣布对其AI智能体开发平台进行重大升级,全面扩展开发者生态、优化语音交互能力,并加强执行过程中的可观测性。这一系列更新显著提升了构建语音驱动多模态应用的效率与可靠性,标志着AI智能体从原型向产品级演进迈出新的一步。

此次升级的重头戏之一是 Agents SDK 对 TypeScript 的全面支持,此前该工具仅支持 Python。新增的 TypeScript 版本具备与 Python 对等的核心组件,包括任务转交机制(Handoffs)、运行约束系统(Guardrails)以及追踪系统(Tracing),并兼容 MCP 模型上下文协议,确保智能体在任务链中保持上下文连续性。这一更新让 Web 和云原生开发者可以在 Node.js 和浏览器环境中无缝创建和部署智能体,大幅扩展开发应用的可能性。

据 ITCOW牛新网了解,OpenAI 此次还推出了名为 RealtimeAgent 的实时执行模式,专为低延迟语音应用场景设计。它集成了音频输入输出处理、状态交互与中断响应机制。更值得关注的是引入了“人机回路”(HITL)功能,允许开发者在运行时手动插入审核节点,对智能体执行进行审批和人工确认。这一机制对需要人工监管或合规审查的应用场景具有重要意义,如医疗辅助决策、金融风控等领域。

在调试和系统透明性方面,OpenAI 升级了 Traces 仪表盘,现已支持实时语音会话的全流程追踪,包括语音输入输出、工具调用记录、用户中断等信息,为开发者提供统一的审计与调优界面。这一功能提升了系统稳定性,也方便了开发者进行性能分析与故障排查。

此外,OpenAI 也对其 语音对语音模型进行改良,显著提升了交互自然度与响应速度。更新内容包括更快的流式语音生成、更具表现力的音频输出,以及对用户重叠发言的鲁棒处理能力。这些改进将助力开发者打造更具沉浸感与实时响应能力的多模态对话体验。