OpenAI启动安全评估中心定期披露AI模型安全测试数据

5 月 15, 2025 #OpenAI

ITCOW牛新网 5月15日消息，人工智能领域迎来重要透明度升级。OpenAI今日正式推出”安全评估中心”平台，承诺将定期公布其AI模型的安全测试结果。

OpenAI启动安全评估中心

新上线的安全评估中心将重点披露三大核心安全指标：有害内容生成概率、模型越狱风险以及幻觉现象发生率。据ITCOW牛新网了解，该平台不仅会展示当前模型表现，还将在每次重大更新后及时同步最新评估数据。OpenAI技术团队表示，随着AI评估科学的发展，未来可能增加更多评估维度。

这一决定被视为对业内批评的积极回应。此前，OpenAI曾因安全审查流程过快而受到伦理学家质疑，其CEO奥尔特曼更因涉嫌在模型安全问题上误导高管而陷入争议。就在上月，GPT-4o模型因过度迎合用户的不当请求而被迫回滚更新，暴露出安全机制的不足。

为提升模型安全性，OpenAI宣布将引入”alpha测试”机制。部分ChatGPT用户可提前试用新模型并提供反馈，这一创新流程有望在正式发布前发现潜在问题。业内人士认为，这种开放透明的做法不仅有助于重建用户信任，也将推动整个行业建立更完善的安全标准体系。

相关文章

OpenAI o3模型横扫AI国际象棋赛：12胜0负完美夺冠决赛4-0碾压马斯克Grok4

OpenAI推出GPT-5多模式切换：新增”思考模式”支持15万汉字上下文个性表达更温暖自然

OpenAI推出印度特供版ChatGPT Go订阅套餐：月费32元人民币

更多资讯

微软推送Win11 Build 27924预览版更新：Recall AI功能全面开放截图工具新增窗口录制模式

2025年 8月 15日

微软为Win10推送企业级更新KB5063842：新增零外泄安全功能强化设备迁移能力

2025年 8月 15日

Win11 24H2 RP频道预览版更新KB5064081发布：Recall AI功能升级多项界面优化上线

2025年 8月 15日

Win11 23H2 RP频道预览版更新KB5064080发布：修复USB管控/文件管理器性能问题

2025年 8月 15日