Physical AI 需要告别“数据小时数崇拜”:有效信息密度才是关键
“金球指标”错位:机器人行业陷入数据小时数迷信
曾任多伦多大学、现任佐治亚理工学院的机器人学者 Animesh Garg 在其文章《Moneyball for Physical AI》中,将当前具身智能(Physical AI)领域的数据竞赛比作棒球史上的“金球”时刻。他指出,许多机器人公司和投资者正陷入一种危险的叙事:只要堆砌更多遥操作小时、更多真实部署时间,就能自然形成“数据飞轮”。然而,Garg 警告,累计运行小时数并不等同于模型能力的有效提升。
数据≠信息:三类机器人数据的价值差异
Garg 将 Physical AI 数据划分为三类:观察数据、干预数据和部署数据。观察数据(如第一人称视频)成本低、覆盖广,但缺乏动作指令;干预数据(如遥操作轨迹)直接关联状态到动作,但采集成本高昂;部署数据虽来自真实商业场景,却往往集中在高度结构化、低变化的环境中,导致信息密度迅速衰减。
重复样本的边际效益快速递减
与大语言模型可从互联网获取近乎无限的文本不同,机器人数据必须通过真实物理交互生成,每一小时有效数据背后都涉及设备、人力、安全与失败处理成本。Ken Goldberg 曾提出“10万年数据鸿沟”概念,强调机器人缺乏类似文本AI的海量低成本数据源。Garg 进一步指出,若仅追求总小时数,资金可能流向大量重复、低难度样本,而非能显著降低失败率的关键长尾场景。
部署飞轮的前提:早期场景必须足够“新”
当前主流商业化路径是“neo-integrator”模式:在窄任务中部署机器人,用人类远程接管保障可用性,同时收集生产数据以训练更强模型。但 Garg 强调,该飞轮成立的前提是早期部署场景能提供足够新颖、多样化的数据。若场景过于固定(如标准化仓储),数据很快饱和,公司收获的不是通用能力,而是一堆需持续维护的定制化项目,反而拖累规模化进程。
估值逻辑亟待重构:从“攒了多少小时”到“买了多少新信息”
Garg 呼吁资本市场重新评估 Physical AI 公司的数据资产。累计运行时间、遥操作团队规模等运营指标不应被直接等同于技术壁垒。更关键的问题包括:单任务数据何时饱和?新增任务需多少工程成本?生产数据中有多少是分布外异常?他建议,高成本干预数据应在单任务饱和后转向新任务探索,部署数据则应重点筛选失败与边界案例,剔除低信息密度的成功片段。最终,衡量标准应是“每一美元买到的新颖样本数量”,而非单纯的小时数。






