ITCOW牛新网 12月12日消息,AI视频生成公司Runway正式推出其首个通用世界模型GWM-1,该模型通过逐帧预测技术,能够创建具备物理规律理解能力的仿真场景,还原世界随时间推移的真实变化规律。这一突破标志着Runway正式跻身世界模型赛道,与谷歌、OpenAI等科技巨头展开竞争。

GWM-1并非单一算法架构,而是由三个经过专项训练的子系统协同运作:GWM-Worlds用于创建交互式虚拟场景,GWM-Robotics为机器人训练提供合成数据,GWM-Avatars则专注于生成具备真实人类行为逻辑的数字人。该模型能够理解重力、碰撞、流体效果等物理规律,例如预测”苹果从高处掉落”的轨迹,或模拟水流在容器中的动态变化。

Runway首席技术官Anastasis Germanidis在直播中强调:”要构建世界模型,首先需要打造一个真正出色的视频模型。我们相信,直接预测像素是实现通用模拟的最佳途径。通过足够规模和合适数据,模型就能理解世界运作的方式。”
GWM-Worlds允许用户通过文字提示或图像设定场景,生成以24帧/秒、720p分辨率运行的动态世界,支持车辆移动、船只航行等复杂场景,并保持画面连贯性长达数分钟。该技术不仅适用于游戏开发,还能作为训练AI智能体在物理世界导航和决策的虚拟沙盒。

GWM-Robotics通过合成数据模拟天气变化、动态障碍物等变量,帮助机器人在高风险或难以复现的真实场景中预演行为。该系统还能识别机器人在何种条件下可能违反安全策略,为可靠性验证提供新工具。Runway已计划通过SDK向合作伙伴开放此模块,目前正与多家机器人制造企业进行深度接洽。

GWM-Avatars则致力于生成具备真实人类行为逻辑的数字人,适用于通信和培训场景,如虚拟客服、教育模拟等。尽管目前三大分支在技术上相互独立,但Runway明确表示,其终极愿景是将它们整合为一个统一的通用世界模型。

Gen 4.5视频生成模型新增原生音频生成、音频编辑及多镜头视频剪辑功能。用户现在可以生成一分钟以内、角色连贯、带原生对话和背景音的复杂视频,还能编辑现有音频和多镜头视频。这一系列功能的加入,使得Runway的工具箱愈发接近一体化的影视生产套件。
值得注意的是,Runway的Gen 4.5视频模型在Video Arena排行榜上已超越谷歌和OpenAI,而GWM-1则被称为比谷歌Genie-3等竞争对手更”通用”的世界模型。

为支撑日益庞大的算力需求,Runway宣布与专注于AI的云计算公司CoreWeave达成合作。根据协议,Runway将在CoreWeave的云基础设施上调用英伟达GB300 NVL72机架,用于训练与推理未来的模型。CoreWeave联合创始人Brian Venturo表示:”Runway已在科技行业和好莱坞顶尖创意工作室中确立了其作为生成式视频先驱的地位。”
Runway的战略重心正从好莱坞等娱乐产业向科研与工业领域拓展,包括机器人技术、物理学及生命科学研究等新领域。然而,在机器人技术等新赛道中,该公司需直面谷歌、微软等科技巨头的竞争。尽管Runway凭借创意工具在影视行业积累了优势,但其在科研领域的差异化竞争力尚未得到验证,未来市场表现仍存变数。
英伟达CEO黄仁勋今日向Runway CEO Cristóbal Valenzuela发送了祝贺视频。随着世界模型从纸面理论走向工程落地,Runway正用”像素即物理”的独特哲学,搭建一座连接虚拟仿真与现实行动的桥梁。