全球第一！智元世界模型登顶权威榜单，仿真大脑进入关键期

近日，全球具身智能领域权威榜单WorldArena公布最新评测结果，智元机器人（Agibot）自研的世界模型Genie Envisioner-Sim 2.0（以下简称GE 2.0）在Track1（世界模型感知与动作响应赛道）中斩获总分冠军，超越包括BWM-Fast、SparkWorld在内的多家国内外知名团队模型。

在行业观察者看来，这一成绩不仅标志着智元在“机器人大脑”核心技术上取得突破，更被视为具身智能从“实验室研发”迈向“真实场景规模化部署”的关键信号。

WorldArena是具身智能领域聚焦世界模型技术的核心评测平台，其地位堪比AI界的“奥运会”或“高考”。

它由清华大学联合普林斯顿、北大、新加坡国立大学等8所全球顶尖学术机构研发，专门用来给“具身世界模型”（可以理解为机器人的虚拟大脑与数字训练场）打分和排名。

此次揭晓的榜单主要分为两大赛道：一是评估生成视频合理性的“视频感知质量”赛道；二是直接考验模型在真实机器人任务中实用性的“具身任务功能性”赛道。智元夺冠的Track1，正是聚焦于具身智能最本质的“认知与行动”闭环能力，被业界视为评判通用人形机器人智能化水平的核心标尺。

值得注意的是，此次智元夺冠的模型GE-Sim 2.0并未针对赛题进行特殊优化，仅基于榜单数据进行了基础微调。这种“轻装上阵”仍能拔得头筹的表现，被团队解读为其技术底座具备强大的通用适配性。

智元技术团队指出，GE 2.0的突破在于实现了从“感知预测”到“仿真进化、自主决策”的闭环升级。其技术报告披露，模型在长时序推演、多视角生成、本体状态建模等环节构建了完整能力矩阵：在连续40-50秒的长视频推演中，画面质量衰减显著低于行业基线；通过闭环评测验证，模型与真实世界的任务成功率保持强相关性，其混淆矩阵分析更佐证了作为策略评测器的可靠性。

“这证明了GE 2.0不仅能生成‘看起来真实’的虚拟场景，更能成为机器人试错、迭代的‘训练场’。”智元技术负责人表示。

实验数据显示，模型通过奖励机制筛选的有效数据回流，已帮助策略模型在多项任务中实现性能显著提升，为机器人从虚拟仿真到物理落地的“最后一公里”提供了技术支撑。

“未来竞争的核心，不再是单一模态的性能参数，而是技术闭环的完整度与产业落地的适配性。”有行业分析师指出，智元在WorldArena的胜出，本质是其“全功能世界模拟器”技术路线的胜利——当机器人能在虚拟世界完成经验积累与动态试错，真实场景的规模化部署才具备经济可行性。

采写：南都·湾财社记者胡雯雯