近日,全球具身智能领域权威榜单WorldArena公布最新评测结果,智元机器人(Agibot)自研的世界模型Genie Envisioner-Sim 2.0(以下简称GE 2.0)在Track1(世界模型感知与动作响应赛道)中斩获总分冠军,超越包括BWM-Fast、SparkWorld在内的多家国内外知名团队模型。

在行业观察者看来,这一成绩不仅标志着智元在“机器人大脑”核心技术上取得突破,更被视为具身智能从“实验室研发”迈向“真实场景规模化部署”的关键信号。

WorldArena是具身智能领域聚焦世界模型技术的核心评测平台,其地位堪比AI界的“奥运会”或“高考”。

它由清华大学联合普林斯顿、北大、新加坡国立大学等8所全球顶尖学术机构研发,专门用来给“具身世界模型”(可以理解为机器人的虚拟大脑与数字训练场)打分和排名。

此次揭晓的榜单主要分为两大赛道:一是评估生成视频合理性的“视频感知质量”赛道;二是直接考验模型在真实机器人任务中实用性的“具身任务功能性”赛道。智元夺冠的Track1,正是聚焦于具身智能最本质的“认知与行动”闭环能力,被业界视为评判通用人形机器人智能化水平的核心标尺。

值得注意的是,此次智元夺冠的模型GE-Sim 2.0并未针对赛题进行特殊优化,仅基于榜单数据进行了基础微调。这种“轻装上阵”仍能拔得头筹的表现,被团队解读为其技术底座具备强大的通用适配性。



智元技术团队指出,GE 2.0的突破在于实现了从“感知预测”到“仿真进化、自主决策”的闭环升级。其技术报告披露,模型在长时序推演、多视角生成、本体状态建模等环节构建了完整能力矩阵:在连续40-50秒的长视频推演中,画面质量衰减显著低于行业基线;通过闭环评测验证,模型与真实世界的任务成功率保持强相关性,其混淆矩阵分析更佐证了作为策略评测器的可靠性。

“这证明了GE 2.0不仅能生成‘看起来真实’的虚拟场景,更能成为机器人试错、迭代的‘训练场’。”智元技术负责人表示。

实验数据显示,模型通过奖励机制筛选的有效数据回流,已帮助策略模型在多项任务中实现性能显著提升,为机器人从虚拟仿真到物理落地的“最后一公里”提供了技术支撑。

“未来竞争的核心,不再是单一模态的性能参数,而是技术闭环的完整度与产业落地的适配性。”有行业分析师指出,智元在WorldArena的胜出,本质是其“全功能世界模拟器”技术路线的胜利——当机器人能在虚拟世界完成经验积累与动态试错,真实场景的规模化部署才具备经济可行性。

采写:南都·湾财社记者 胡雯雯