正文

Physical AI 需要告别“数据小时数崇拜”：有效信息密度才是关键

编辑：Hollowzep发布时间：1天前

“金球指标”错位：机器人行业陷入数据小时数迷信

曾任多伦多大学、现任佐治亚理工学院的机器人学者 Animesh Garg 在其文章《Moneyball for Physical AI》中，将当前具身智能（Physical AI）领域的数据竞赛比作棒球史上的“金球”时刻。他指出，许多机器人公司和投资者正陷入一种危险的叙事：只要堆砌更多遥操作小时、更多真实部署时间，就能自然形成“数据飞轮”。然而，Garg 警告，累计运行小时数并不等同于模型能力的有效提升。

数据≠信息：三类机器人数据的价值差异

Garg 将 Physical AI 数据划分为三类：观察数据、干预数据和部署数据。观察数据（如第一人称视频）成本低、覆盖广，但缺乏动作指令；干预数据（如遥操作轨迹）直接关联状态到动作，但采集成本高昂；部署数据虽来自真实商业场景，却往往集中在高度结构化、低变化的环境中，导致信息密度迅速衰减。

重复样本的边际效益快速递减

与大语言模型可从互联网获取近乎无限的文本不同，机器人数据必须通过真实物理交互生成，每一小时有效数据背后都涉及设备、人力、安全与失败处理成本。Ken Goldberg 曾提出“10万年数据鸿沟”概念，强调机器人缺乏类似文本AI的海量低成本数据源。Garg 进一步指出，若仅追求总小时数，资金可能流向大量重复、低难度样本，而非能显著降低失败率的关键长尾场景。

部署飞轮的前提：早期场景必须足够“新”

当前主流商业化路径是“neo-integrator”模式：在窄任务中部署机器人，用人类远程接管保障可用性，同时收集生产数据以训练更强模型。但 Garg 强调，该飞轮成立的前提是早期部署场景能提供足够新颖、多样化的数据。若场景过于固定（如标准化仓储），数据很快饱和，公司收获的不是通用能力，而是一堆需持续维护的定制化项目，反而拖累规模化进程。

估值逻辑亟待重构：从“攒了多少小时”到“买了多少新信息”

Garg 呼吁资本市场重新评估 Physical AI 公司的数据资产。累计运行时间、遥操作团队规模等运营指标不应被直接等同于技术壁垒。更关键的问题包括：单任务数据何时饱和？新增任务需多少工程成本？生产数据中有多少是分布外异常？他建议，高成本干预数据应在单任务饱和后转向新任务探索，部署数据则应重点筛选失败与边界案例，剔除低信息密度的成功片段。最终，衡量标准应是“每一美元买到的新颖样本数量”，而非单纯的小时数。