ITCOW牛新网 6月16日消息,阿里巴巴今日揭晓了千问大模型家族中首个完整的具身智能模型系列——Qwen-Robot。该系列包含专为机械臂操作设计的视觉—语言—动作(VLA)模型 Qwen-RobotManip、负责视觉—语言—导航(VLN)的移动模型 Qwen-RobotNav,以及构建环境认知的世界模型 Qwen-RobotWorld。三者分别对应机器人的灵巧「手」、认路的「脚」与能思考的「大脑」,既可独立部署于不同形态机体,也能协同运转,为国产具身智能机器人走向真实场景提供了统一的软件底座。

阿里千问发布具身智能大模型 Qwen-Robot 系列

据ITCOW牛新网了解,此次发布是阿里在物理世界 AI 领域的重要落子。Qwen-RobotManip 聚焦物体抓取、精细操作与多物体排序等双臂或单臂作业任务;Qwen-RobotNav 使移动底盘或人形机器人具备自然语言指令驱动的室内外点—点导航与避障能力;Qwen-RobotWorld 作为世界模型则负责预测环境状态演变与物理常识推理,辅助前两者做更合理的动作规划。整套系列继承千问大模型的多模态理解能力,并针对机器人传感器数据(深度图、关节编码器读数、IMU 信号等)做了专项微调与量化适配,可运行在边缘算力有限的机载芯片上。

阿里千问发布具身智能大模型 Qwen-Robot 系列

将具身智能作为一个独立系列纳入千问生态,也延续了阿里近期在 AI 垂直化方向的布局节奏。就在上月 5 月 20 日,阿里刚刚发布了全新一代旗舰文本—多模态模型 Qwen3.7-Max,该模型在三方机构 Arena 全球盲测总榜中超越 Kimi-K2.6、DeepSeek-v4-pro 及 GLM-5.1,与 GPT、Claude、Gemini 最强版本接近,位列国产模型第一。Qwen-Robot 系列的推出,意味着千问大模型从数字空间向物理空间的渗透正式开启,未来有望通过开源权重与仿真—实机联合训练工具链,进一步降低国内机器人企业的算法自研门槛。