人形(18.440, -0.57, -3.00%)迎来统一的“数据语言”。在近日举办的2025浦江创新论坛分论坛上,上海发布了国内首个具身智能标准化数据集平台和人形机器人数据集标准。该标准通过建立一套可互通的数据采集、标注与存储规范,为人形机器人产业构建起统一的数据“度量衡”,使不同主体的数据能按同一标准流转与应用,为具身智能国际标准化事业贡献了“中国方案”。
同时,国家机器人检测与评定中心(总部)还为智元创新(上海)科技有限公司(以下简称“智元”)等三家企业颁发了首批人形机器人数据集CR产品认证(中国机器人产品认证)证书。此举标志着标准化数据在产业应用中得到了权威认可,我国在人形机器人数据集标准化、质量评价与产业应用上迈出关键一步。
高质量、多样化的数据集是人形机器人实现具身智能的核心“燃料”,数据标准则是“燃料”的基石。笔者认为,一系列标准化平台和认证的发布,对于人形机器人产业化具有三重意义。
第一,为构建协同共生的产业生态提供核心支撑。当前,人形机器人竞争已从“硬件参数比拼”进入“数据生态对决”,标准化是激活数据价值的前提。长期以来,行业缺乏数据标准化认证和研发通用平台,分类编码、数据标注、格式及管理规范的不统一,成为具身智能产业落地的瓶颈。这种“数据孤岛”不仅让企业“重复造轮子”,增加了研发成本,还阻碍了技术协同创新与规模化应用。一位业内专家曾向笔者形容:“机器人没有统一数据标准,就像新能源汽车没有统一充电规范,各厂商使用不同接口的充电桩,无法形成产业发展合力。”
本次发布的人形机器人数据集标准明确了分类与编码、数据标注、质量评价、存储格式等核心要求,为行业建立起统一的“数据语言”:一方面让不同机构的数据可共享兼容,打破“数据孤岛”;另一方面也降低了中小厂商研发门槛,使其更加聚焦核心算法的创新。
在此基础上,国内首个具身智能标准化数据集平台“浦江X”(穹顶-DOME)同步发布,其全面贯通数据采集、治理、训练与验证全链路,实现了多模态数据的标准化生产与高效流通,系统性地填补了我国在具身智能数据标准与认证体系方面的空白,筑牢了国家级数字基础设施与标准底座。
第二,为人形机器人在多场景落地打下基石。人形机器人的价值,最终要在具体应用场景中兑现。但不同应用场景对训练数据的需求差异显著:工业场景需要高精度的装配操作数据,家居场景依赖贴近生活的交互行为数据,医疗场景则对安全规范数据有大量需求。此前因缺乏统一标准,企业往往分散采集训练,不仅投入高,还常因数据质量参差不齐导致机器人在场景中“水土不服”,难以实现规模化应用。