正文

浙大团队新突破:用人脑分类方式提升AI抽象理解能力

编辑:星球日报发布时间:15小时前

研究背景:模型规模与认知能力的矛盾

当前大模型的发展趋势是不断增大参数规模,主流观点认为模型参数越多,就越接近人类思考的方式。然而,浙江大学研究团队的一项最新研究表明,这种观点并不完全正确。他们的研究发现,当模型规模扩大时,虽然识别具体事物的能力有所提升,但对抽象概念的理解能力却并未同步提高,甚至可能出现下降。

研究显示,当模型参数从2206万增加到3.0437亿时,具体概念任务的准确率从74.94%提升到85.87%,而抽象概念任务的准确率却从54.37%下降到52.82%。这一现象揭示了当前AI模型在处理抽象概念时的短板。

人脑与AI的认知差异

人类大脑在处理概念时,会自然形成一套分类关系。例如,天鹅和猫头鹰虽然外形不同,但人类会将它们归为“鸟”这一类别;再往上,“鸟”和“马”会被归入“动物”这一更大的类别。当面对新事物时,人类会基于已有经验快速判断其所属类别,并将其融入已有的知识体系中。

浙大研究团队提出新路径:把人脑理解世界的方式教给 AI

相比之下,AI模型的分类方式主要依赖于大规模数据中反复出现的形式。对于具体对象,模型能够通过大量样本学习识别,但在更大类别的归纳上,模型的表现则较为吃力。这导致模型在面对新事物时,往往停留在表面特征,难以像人类一样灵活运用已有经验。

解决方案:用脑信号约束模型结构

针对这一问题,浙大团队提出了一种全新的解决方案:通过少量脑信号对模型进行监督,使其内部结构更接近人脑的分类方式。研究团队利用人类观看图片时的大脑活动记录,将人脑的分类结构(human conceptual structures)传递给深度神经网络(DNNs)。

浙大研究团队提出新路径:把人脑理解世界的方式教给 AI

实验结果表明,经过这种训练后,模型与人脑表征之间的距离显著缩小。无论是训练类别还是测试类别,模型都表现出更强的学习能力,尤其是在样本较少的情况下,其性能提升尤为明显。

实验成果:抽象任务表现大幅提升

团队使用150个已知训练类别和50个未见过的测试类别进行了实验。结果显示,在极少示例的情况下,模型区分生物和非生物等抽象概念的能力平均提升了20.5%,甚至超过了参数量更大的对照模型。此外,团队还进行了31组专门测试,几类模型的表现均提升了近一成。

浙大研究团队提出新路径:把人脑理解世界的方式教给 AI

未来方向:从规模扩张到认知结构优化

过去几年,AI行业的主要发展方向是不断扩大模型规模。然而,浙大团队的研究表明,单纯追求规模扩张并不能解决所有问题,尤其是抽象理解和迁移能力的提升。未来,AI的发展需要更加关注认知结构本身,让模型的思考方式更接近人脑。

这一研究也引出了更大的可能性:AI的进化不仅限于模型训练阶段。进入真实世界后,AI agent还需要通过持续预测、验证和优化来实现进一步成长。Neosoul正是在这一方向上进行探索,通过构建一个持续筛选和优化的系统,让AI agent在真实环境中不断进化。

浙大团队与Neosoul共同指向的目标是:让AI不仅具备强大的解题能力,更要拥有全面的思考能力和自我进化的能力。