随着大语言模型(LLM)与视觉语言模型(VLM)的爆发式突破,人工智能已在数字空间展现出
惊人的认知与推理能力。 如今,这股技术浪潮正加速向物理世界外溢,推动机器人从单一功能的
自动化设备,向具备通用理解与决策能力的具身智能(Embodied AI)进化。然而,要实现从
「实验室智能」向「现实世界智能」的跨越,行业仍需克服真实环境下的验证难、测试条件非
标、公开平台缺失等挑战。构建一个开放、公正、可复现的「真实考场」,已成为行业迈向通用
化的必经之路。
RoboChallenge 正是为解决这一核心命题而生。作为由原力灵机 Dexmal 与 Hugging Face 联合
推出的全球首个具身智能大规模真机评测平台,RoboChallenge 致力于通过科学的评测体系,为
视觉-语言-动作模型(VLAs)在机器人的实际应用提供更加可靠和可比较的评测标准。自 2025
年 10 月 15 日上线以来,平台已成功部署了包含 UR5、Franka、ARX5、ALOHA 等主流机型在
内的 20 台真机测试集群,并开源了涵盖 9 大类、30 个标准化桌面任务的 Table30 数据集。
为进一步凝聚行业力量,加速具身智能真机评测标准的规范化进程,原力灵机 Dexmal 与
Hugging Face 联合智源研究院、智元机器人、Qwen、星海图、自变量、清华大学、西安交通大
学及 GOSIM 等单位,于 2025 年 11 月 20 日正式成立 RoboChallenge 组委会,旨在通过产学
研深度协同以广泛的行业共识定义具身智能真机评测标准
部分场景 如把碗叠放在一起成功率、分选水果等基础任务已经接近100%
机器人落地真实应用更进一步走入现实。

中文版本报告获取地址
https://robochallenge.cn/2025%20RoboChallenge%20%E5%B9%B4%E5%BA%A6%E6%8A%A5%E5%91%8A.pdf