
产业链全景四层结构谁在哪个位置具身智能数据产业链可拆成四层。最底层是采集层主要有居家采集员新闻报道里的宝妈们戴夹爪设备在自家客厅叠衣服、擦桌子宣传时薪30元实际有效时薪约17元月收入3000 - 4000元、场地采集员在数据采集中心全职工作的大专毕业生穿戴动捕设备日薪180 - 250元折算时薪22 - 31元、真机遥操作员专业技术人员穿戴力反馈手套手把手教机器人完成精密操作日薪300元以上时薪75元以上这是精度最高、成本也最高的采集方式、UMI采集员穿戴鹿明FastUMI Pro这类无本体采集设备不需机器人本体参与成本降至遥操作的1/5适合更精细化的数据采集四类人采集提供物理动作基础数据。第二层是平台层作为连接采集员和数据公司的中间商核心角色是组织者连接供需、管理流程甚至提供物理空间和操作场景并从中抽成。今年5月京东在宿迁建了全国首个具身智能数据采集社区计划发动10万 员工和50万行业人员此外还有数不清的第三方外包团队和小型组织者。外包平台从数据公司接单分包给采集员中间抽取30% - 50%的差价。除外包平台外产业链运作还需基础设施建设者如鹿明机器人、觅蜂科技、凌云光等设备提供商研发生产硬件一套动捕设备10 - 50万元一套UMI设备约2800元利润模式是设备租赁/售卖。第三层是数据层代表企业是光轮智能、智域基石、它石智航、觅蜂科技这些公司把底层采集来的原始数据经过清洗、标注、对齐、仿真增强打包成可训练的数据产品卖给下游客户。第四层是应用层掏钱买数据的金主代表企业有三类人形机器人本体公司如宇树、优必选、智元、银河通用、特斯拉等需要真机数据训练模型、世界模型/大模型团队典型企业如Google DeepMind、NVIDIA、World Labs需要人类行为数据理解物理世界、产业应用方如工厂、物流、医疗需要场景适配数据。具身智能数据产业链是经典的“金字塔模型”底层是大量廉价劳动力中层是抽成的平台和卖设备的公司顶层是掌握数据资产和复售能力的数据公司采集员是整个链条的燃料。数据售卖模式从17元到300元的鸿沟先算采集成本居家采集员有效时薪17元场地采集员日薪180 - 250元按8小时算时薪22 - 31元UMI采集方案成本是传统遥操作的1/5鹿明的FastUMI Pro将单条数据采集时间从50秒压缩到10秒估算时薪成本约55元真机遥操作成本最高单小时有效数据成本在规模化运营后约275元设备折旧 人工 场景小规模采集时可达数千元。再算售价澎湃新闻2025年5月调查给出行业定价区间具身智能数据总体定价在200 - 500元/小时其中真机数据最贵市场价500 - 1000元/小时。觅蜂科技CEO姚卯青透露不依赖特定机器人本体的无本体数据价格最终会收敛到真机数据的二分之一到三分之一即300 - 400元/小时。采集方式越“低端”差价倍数越大真机遥操作员拿到275元终端售价800元只有2.9倍居家采集员拿到17元数据公司能以300元卖出有17.6倍的利差。这17元时薪和300元售价之间283元的差额被平台抽成、数据公司的技术处理、设备折旧、以及数据资产的复售溢价等层层分走但这还不是数据公司真正的利润来源。光轮智能的魔法不是卖一次是卖十次光轮智能是这个层级的标杆企业成立后短短三年迅速融资壮大成为今年新晋独角兽企业估值超10亿美元。截至2026年初它累计交付超150万小时高质量人类数据覆盖2.5万个环境节点、10万种任务类型2026年第一季度新增订单5.5亿元。粗算平均售价约367元/小时看起来是行业水平利润率也不是很高。但这种算法假设数据只能卖一次实际上光轮智能将“数据复售率”概括为单位小时的数据能够服务多少个不同客户和任务需求其联合创始人杨海波说“在优质场景的数据复售率已经能够超过10倍。” 同一份数据可卖给宇树、优必选、智元、银河通用等每多卖一次边际成本几乎为零只需要做一些格式转换和场景适配但收入是实打实的。这才是数据公司真正的商业模式一次性投入采集成本然后通过复售无限摊薄边际成本。数据本质和软件一样复制成本趋近于零每多卖一次毛利率就往上跳一截。这个逻辑解释了资本市场给光轮智能100亿元估值的原因不是因为它有150万小时的数据而是因为这150万小时的数据可能被卖1500万次。千亿市场规模下数据售卖可持续吗2026年中国具身智能市场规模预计突破1万亿元其中数据服务占比超15%市场规模约达1500亿元。但第三方数据复售模式占比多少尚不得而知且这类商业模式存在隐忧。头部机器人厂商早已意识到数据建设重要性开始搭建自研中心如智元机器人2026年成立具身智能数据平台觅蜂科技宇树科技此次IPO招股募资将自主搭建大规模真实数据集其对第三方数据的采购需求会下降。此外一些成熟数据逐渐被头部企业、科研机构免费开放冲击数据售卖模式例如今年3月底宇树科技宣布人形机器人高质量全身遥操作真机数据集UnifoLM - WBT - Dataset正式开源覆盖340小时、合计189万条动作轨迹数据。不过目前全球开源数据体量仍较少未形成规模化效应。第三方数据服务商核心竞争力源于覆盖多场景的数据积累但具身智能要在复杂工业场景落地需要真实工业现场数据若头部机器人通过合作可直接获取工厂真机交互、动态场景的第一手数据第三方数据的性价比优势会被弱化。未来第三方数据售卖模式可能向两个方向收缩一是服务没有能力自研数据的中小机器人厂商二是提供自身难以覆盖的小众细分场景数据。