6月16日,阿里巴巴正式发布千问具身智能大模型Qwen-Robot系列,该系列由VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav以及世界模型Qwen-RobotWorld三大核心矩阵组成。针对传统VLA模型换硬件、换场景后迁移能力不足的行业痛点,Qwen-RobotManip引入了一套80维的统一动作表征,为不同形态的硬件定义了通用的“肢体语言”,使其在不同设备中仅需数步反馈即可自动适配。负责跑腿认路的VLN模型Qwen-RobotNav则基于Qwen-VL构建,首次将语言指令导航、目标搜索、自动驾驶等五大任务族统一到单一框架中,消除了复杂任务下的模型切换成本。作为思考大脑的Qwen-RobotWorld则赋予系统物理世界的推理能力,能够预测并模拟下一步的动作与状态。
网友评论