Karpathy为何突然加入Anthropic,甘愿成为Dario的「-2」?
Andrej Karpathy官宣加入Anthropic
5月19日晚上11点,Andrej Karpathy亲自在社交媒体上宣布了他加入Anthropic的消息。
这个名字无需多解释。作为OpenAI联合创始人、特斯拉前AI总监、「Vibe Coding」之父以及全球最具影响力的AI教育者之一,Karpathy的地位犹如篮球界的詹姆斯,无论到哪里都会引发关注。
他在X平台上仅用三句话表达了这一决定:
第一句提到LLM前沿未来几年将「尤其具有塑造性」;第三句则表明他对教育事业依然充满热爱;而中间那句最为关键——「回归研发」。
为什么选择Anthropic?
这是两年内第三位从OpenAI阵营转投Anthropic的核心人物,同时也是即将40岁、功成名就且财务自由的Karpathy主动选择去担任别人的下属。
那么问题来了:他为何离开?为什么选择Anthropic?Anthropic又为何如此迫切地希望他加入?
每一个问题背后都有值得深入探讨的原因。
Karpathy的新角色:预训练团队中的新子团队负责人
Karpathy本周已经开始工作,并进入了Anthropic的预训练团队。该团队由Nick Joseph领导,负责Claude所有大规模训练运行。
Anthropic发言人向TechCrunch确认,Karpathy将组建一个新的子团队,专注于利用Claude自身加速预训练研究。
Nick Joseph也在X上补充背景信息称:“他将建立一个团队,专注于用Claude加速预训练研究本身。”
TechCrunch评价道:“Karpathy是少数能够在LLM理论与大规模训练实践之间架起桥梁的研究者之一。”Axios则将此事定性为“Anthropic在人才争夺战中的重大胜利”。
人才流动趋势明显
同日宣布加入Anthropic的还有网络安全专家Chris Rohlf,此前xAI创始成员Ross Nordeen也于本月早些时候加入。这种人才流向的方向性越来越清晰。
Polymarket的数据可以作为市场情绪的旁证——交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%,而OpenAI仅为4%。
Karpathy的独特稀缺性
要理解这次加入的重要性,需要了解Karpathy本人的稀缺价值所在。
他的稀缺并不在于技术能力(顶级研究者有很多),而在于他能用一个词改变整个行业对某件事的理解方式。
1986年生于斯洛伐克,15岁移民加拿大多伦多。在多伦多大学读本科时选修了Geoffrey Hinton的课程并参加了他的读书会。
Hinton是深度学习复兴运动的精神领袖,2018年图灵奖得主,2024年诺贝尔物理学奖得主。
Karpathy是最早被这把火点燃的年轻人之一。
学术与职业生涯亮点
之后在Stanford师从另一位传奇人物李飞飞,博士期间创建了CS231n课程。
这门课从2015年的150名学生增长到2017年的750人,全部视频讲义公开上网,成为全球无数工程师自学深度学习的第一站,更是计算机视觉领域的第一神课。
2015年,他成为OpenAI的创始研究科学家。
2017年被马斯克招至特斯拉担任AI高级总监,推动自动驾驶走向纯视觉方案。
定义范式的能力
同年,Karpathy在Medium上发表了一篇文章,提出了「Software 2.0」概念,主张神经网络权重就是新的代码,数据集就是新的源代码,梯度下降就是新的编译器。
这个框架重塑了整个行业对「什么是编程」的认知。
2022年离开特斯拉后,他在YouTube上创建了「Neural Networks: Zero to Hero」系列课程,频道突破百万订阅。
同期的开源项目micrograd、nanoGPT、nanochat,代码量极少但精准击中核心概念,被称为「可运行的教科书」。
2025年2月,他造出了「Vibe Coding」一词,被柯林斯词典选为年度词汇。
6月在YC AI Startup School演讲中提出「Software 3.0」和「Agent的十年」框架,成为当年讨论最广的AI演讲之一。
TIME在2024年将他列入「AI领域最具影响力100人」。
为什么甘愿做「-2」?
Karpathy的职业生涯有一条清晰的线索,他追逐的从来不是头衔。
他做过Hinton和李飞飞的学生、奥特曼的同事、马斯克的直接下属。
每一段经历里,他的组织架构位置都是高层。
现在他加入Anthropic,直接上司是Nick Joseph,预训练负责人。
Nick Joseph汇报给Dario Amodei。
Karpathy在组织架构中排到了第三层。
Nick Joseph是Anthropic创始11人之一,此前在Vicarious和OpenAI工作。
在OpenAI期间,他在安全团队做代码模型,看到GPT-3微调之后能写代码,意识到AI可以自我改进,于是跟着安全团队的领导一起离开,创建了Anthropic。
他的团队训出了Claude全系列模型,包括Mythos。
Karpathy愿意在Nick Joseph下面做研究,原因很简单,这个位置离他想做的事最近。
Anthropic的战略吸引力
回溯他的每一次职业变动,驱动力都是同一个,“此刻最大的实验在哪里”。
2017年去Tesla,因为自动驾驶是Software 2.0最大的实验场。
2022年离开,因为架构已定,剩下的是工程优化。
2023年回OpenAI,因为ChatGPT随着GPT-4发布带来的爆发期是最刺激的前沿。
2024年创办Eureka Labs,想验证AI原生教育的假设。
2026年加入Anthropic,因为“用AI研究AI”的预训练革命正在这里发生。
每一次离开都不是出于不满,而是当下的位置不再是最大的实验所在。
Anthropic的招聘动机
Anthropic的招聘动机可以分成几层。
最表层是技术需求。
Anthropic的算力预算再大,也比不过微软撑腰的OpenAI和坐拥TPU的谷歌。
纯堆算力的竞赛,Anthropic赢不了。
它必须找到一种用更少算力训出更好模型的方法。
“用Claude加速预训练研究”就是这条路线,而Karpathy同时具备预训练理论深度、大规模工程经验、和对AI辅助研究的直觉,三者兼备的人极少。
人才信号与品牌镀金
再往下是人才信号。
两年三位OpenAI核心人物单向流入Anthropic,“一线研究者用脚投票”的叙事已经成型。
每一个Karpathy级别的加入,都在降低下一个顶级人才加入的心理门槛。人才吸引人才,飞轮自转。
还有IPO前的品牌镀金。
Anthropic正在以9000亿美元估值谈300亿美元融资,IPO准备也在推进。
Karpathy是AI领域公众辨识度最高的技术人物之一,百万YouTube订阅,年度词汇造词者,22万GitHub星标的CLAUD.md仓库。
他的名字出现在Anthropic的员工名单上,直接给了投行一句可以写进招股书的话。
定义范式的能力
但最有意思的一层可能是Anthropic没有明确作为招聘动机、却注定会收获最大回报的东西,Karpathy定义范式的能力。
他在Anthropic做的任何技术探索都会被他公开谈论,推文、博客、YouTube视频。
当他用他特有的方式给正在发生的事情命名时,Anthropic就自然成为那个范式的原产地。
招了一个顶级预训练研究者,附带获得了行业最有影响力的技术叙事者。
技术拐点与AI进化飞轮
把这件人事变动放到更大的背景下看,它标记的是一个技术拐点。
2026年4月,Anthropic发布了Mythos Preview,迄今最强大的AI模型。
Mythos过于强大,仅能通过Project Glasswing受邀内测。
Mythos在没有被专门训练网络安全的情况下,自主发现并利用了FreeBSD中一个存在17年的远程代码执行漏洞,找到了OpenBSD中27年的漏洞和FFmpeg中16年的缺陷。
英国AI安全研究所的独立评估确认,它是第一个能从头到尾完成32步企业网络攻击模拟的模型。
Anthropic自己也承认,这些能力不是刻意训练的结果,是通用推理和软件工程能力提升的“下游涌现”。
预训练做得越好,涌现出的能力越超出预期。
Mythos是当前最强大的模型,也是当前最强大的工具。
Karpathy来Anthropic要做的,就是拿这把最强的锤子,去改进锤子本身的制造方式。
用Mythos/Claude来发现更优的训练架构、数据配比、实验方向,让模型改进的速度脱离人类研究者的线性节奏,转起“AI改进AI”的进化飞轮。
这也是Anthropic最期望的结局。
当这个飞轮真正转起来,“AI自我改进预训练”就不再只是一个研究方向,而是通往AGI乃至ASI的加速通道。
目前所有关于算力军备竞赛、数据壁垒、人才争夺的竞争维度,都可能被这一个变量改写。
三年内,OpenAI失去三位核心人物给同一个竞争对手。
这个事实的影响可能比任何融资数字都大。
算力可以用钱买,数据可以用时间积累,但能让AI进化飞轮转起来的人,全世界一只手数得过来。
Karpathy选择在这个时刻放下自由身份回到一线。他认为窗口就在眼前。






