正文

Karpathy为何突然加入Anthropic，甘愿成为Dario的「-2」？

编辑：星球日报发布时间：16小时前

Andrej Karpathy官宣加入Anthropic

5月19日晚上11点，Andrej Karpathy亲自在社交媒体上宣布了他加入Anthropic的消息。

这个名字无需多解释。作为OpenAI联合创始人、特斯拉前AI总监、「Vibe Coding」之父以及全球最具影响力的AI教育者之一，Karpathy的地位犹如篮球界的詹姆斯，无论到哪里都会引发关注。

他在X平台上仅用三句话表达了这一决定：

第一句提到LLM前沿未来几年将「尤其具有塑造性」；第三句则表明他对教育事业依然充满热爱；而中间那句最为关键——「回归研发」。

为什么选择Anthropic？

这是两年内第三位从OpenAI阵营转投Anthropic的核心人物，同时也是即将40岁、功成名就且财务自由的Karpathy主动选择去担任别人的下属。

那么问题来了：他为何离开？为什么选择Anthropic？Anthropic又为何如此迫切地希望他加入？

每一个问题背后都有值得深入探讨的原因。

Karpathy的新角色：预训练团队中的新子团队负责人

Karpathy本周已经开始工作，并进入了Anthropic的预训练团队。该团队由Nick Joseph领导，负责Claude所有大规模训练运行。

Anthropic发言人向TechCrunch确认，Karpathy将组建一个新的子团队，专注于利用Claude自身加速预训练研究。

Nick Joseph也在X上补充背景信息称：“他将建立一个团队，专注于用Claude加速预训练研究本身。”

TechCrunch评价道：“Karpathy是少数能够在LLM理论与大规模训练实践之间架起桥梁的研究者之一。”Axios则将此事定性为“Anthropic在人才争夺战中的重大胜利”。

人才流动趋势明显

同日宣布加入Anthropic的还有网络安全专家Chris Rohlf，此前xAI创始成员Ross Nordeen也于本月早些时候加入。这种人才流向的方向性越来越清晰。

Polymarket的数据可以作为市场情绪的旁证——交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%，而OpenAI仅为4%。

Karpathy的独特稀缺性

要理解这次加入的重要性，需要了解Karpathy本人的稀缺价值所在。

他的稀缺并不在于技术能力（顶级研究者有很多），而在于他能用一个词改变整个行业对某件事的理解方式。

1986年生于斯洛伐克，15岁移民加拿大多伦多。在多伦多大学读本科时选修了Geoffrey Hinton的课程并参加了他的读书会。

Hinton是深度学习复兴运动的精神领袖，2018年图灵奖得主，2024年诺贝尔物理学奖得主。

Karpathy是最早被这把火点燃的年轻人之一。

学术与职业生涯亮点

之后在Stanford师从另一位传奇人物李飞飞，博士期间创建了CS231n课程。

这门课从2015年的150名学生增长到2017年的750人，全部视频讲义公开上网，成为全球无数工程师自学深度学习的第一站，更是计算机视觉领域的第一神课。

2015年，他成为OpenAI的创始研究科学家。

2017年被马斯克招至特斯拉担任AI高级总监，推动自动驾驶走向纯视觉方案。

定义范式的能力

同年，Karpathy在Medium上发表了一篇文章，提出了「Software 2.0」概念，主张神经网络权重就是新的代码，数据集就是新的源代码，梯度下降就是新的编译器。

这个框架重塑了整个行业对「什么是编程」的认知。

2022年离开特斯拉后，他在YouTube上创建了「Neural Networks: Zero to Hero」系列课程，频道突破百万订阅。

同期的开源项目micrograd、nanoGPT、nanochat，代码量极少但精准击中核心概念，被称为「可运行的教科书」。

2025年2月，他造出了「Vibe Coding」一词，被柯林斯词典选为年度词汇。

6月在YC AI Startup School演讲中提出「Software 3.0」和「Agent的十年」框架，成为当年讨论最广的AI演讲之一。

TIME在2024年将他列入「AI领域最具影响力100人」。

为什么甘愿做「-2」？

Karpathy的职业生涯有一条清晰的线索，他追逐的从来不是头衔。

他做过Hinton和李飞飞的学生、奥特曼的同事、马斯克的直接下属。

每一段经历里，他的组织架构位置都是高层。

现在他加入Anthropic，直接上司是Nick Joseph，预训练负责人。

Nick Joseph汇报给Dario Amodei。

Karpathy在组织架构中排到了第三层。

Nick Joseph是Anthropic创始11人之一，此前在Vicarious和OpenAI工作。

在OpenAI期间，他在安全团队做代码模型，看到GPT-3微调之后能写代码，意识到AI可以自我改进，于是跟着安全团队的领导一起离开，创建了Anthropic。

他的团队训出了Claude全系列模型，包括Mythos。

Karpathy愿意在Nick Joseph下面做研究，原因很简单，这个位置离他想做的事最近。

Anthropic的战略吸引力

回溯他的每一次职业变动，驱动力都是同一个，“此刻最大的实验在哪里”。

2017年去Tesla，因为自动驾驶是Software 2.0最大的实验场。

2022年离开，因为架构已定，剩下的是工程优化。

2023年回OpenAI，因为ChatGPT随着GPT-4发布带来的爆发期是最刺激的前沿。

2024年创办Eureka Labs，想验证AI原生教育的假设。

2026年加入Anthropic，因为“用AI研究AI”的预训练革命正在这里发生。

每一次离开都不是出于不满，而是当下的位置不再是最大的实验所在。

Anthropic的招聘动机

Anthropic的招聘动机可以分成几层。

最表层是技术需求。

Anthropic的算力预算再大，也比不过微软撑腰的OpenAI和坐拥TPU的谷歌。

纯堆算力的竞赛，Anthropic赢不了。

它必须找到一种用更少算力训出更好模型的方法。

“用Claude加速预训练研究”就是这条路线，而Karpathy同时具备预训练理论深度、大规模工程经验、和对AI辅助研究的直觉，三者兼备的人极少。

人才信号与品牌镀金

再往下是人才信号。

两年三位OpenAI核心人物单向流入Anthropic，“一线研究者用脚投票”的叙事已经成型。

每一个Karpathy级别的加入，都在降低下一个顶级人才加入的心理门槛。人才吸引人才，飞轮自转。

还有IPO前的品牌镀金。

Anthropic正在以9000亿美元估值谈300亿美元融资，IPO准备也在推进。

Karpathy是AI领域公众辨识度最高的技术人物之一，百万YouTube订阅，年度词汇造词者，22万GitHub星标的CLAUD.md仓库。

他的名字出现在Anthropic的员工名单上，直接给了投行一句可以写进招股书的话。

定义范式的能力

但最有意思的一层可能是Anthropic没有明确作为招聘动机、却注定会收获最大回报的东西，Karpathy定义范式的能力。

他在Anthropic做的任何技术探索都会被他公开谈论，推文、博客、YouTube视频。

当他用他特有的方式给正在发生的事情命名时，Anthropic就自然成为那个范式的原产地。

招了一个顶级预训练研究者，附带获得了行业最有影响力的技术叙事者。

技术拐点与AI进化飞轮

把这件人事变动放到更大的背景下看，它标记的是一个技术拐点。

2026年4月，Anthropic发布了Mythos Preview，迄今最强大的AI模型。

Mythos过于强大，仅能通过Project Glasswing受邀内测。

Mythos在没有被专门训练网络安全的情况下，自主发现并利用了FreeBSD中一个存在17年的远程代码执行漏洞，找到了OpenBSD中27年的漏洞和FFmpeg中16年的缺陷。

英国AI安全研究所的独立评估确认，它是第一个能从头到尾完成32步企业网络攻击模拟的模型。

Anthropic自己也承认，这些能力不是刻意训练的结果，是通用推理和软件工程能力提升的“下游涌现”。

预训练做得越好，涌现出的能力越超出预期。

Mythos是当前最强大的模型，也是当前最强大的工具。

Karpathy来Anthropic要做的，就是拿这把最强的锤子，去改进锤子本身的制造方式。

用Mythos/Claude来发现更优的训练架构、数据配比、实验方向，让模型改进的速度脱离人类研究者的线性节奏，转起“AI改进AI”的进化飞轮。

这也是Anthropic最期望的结局。

当这个飞轮真正转起来，“AI自我改进预训练”就不再只是一个研究方向，而是通往AGI乃至ASI的加速通道。

目前所有关于算力军备竞赛、数据壁垒、人才争夺的竞争维度，都可能被这一个变量改写。

三年内，OpenAI失去三位核心人物给同一个竞争对手。

这个事实的影响可能比任何融资数字都大。

算力可以用钱买，数据可以用时间积累，但能让AI进化飞轮转起来的人，全世界一只手数得过来。

Karpathy选择在这个时刻放下自由身份回到一线。他认为窗口就在眼前。