正文

Claude Code 50万行代码泄漏:AI Agent的工程秘密与虚拟宠物彩蛋

编辑:星球日报发布时间:3小时前

51.2万行代码意外暴露,Claude Code引发全球关注

51.2万行代码、1906个文件、59.8MB的source map——这一切在3月31日凌晨被Solayer Labs的Chaofan Shou发现。Anthropic的旗舰产品Claude Code因构建工具Bun默认生成source map而意外暴露在公共npm仓库中。几小时内,代码被镜像到GitHub,fork数突破4.1万。

这不是Anthropic第一次犯类似错误。2025年2月Claude Code首次发布时,同样的source map泄漏问题就曾发生过。这次的版本号为v2.1.88,问题根源相同:.npmignore文件漏掉了source map。

模型只是冰山一角:51.2万行代码到底在做什么?

据GitHub社区对泄漏源码的逆向分析,51.2万行TypeScript代码中,直接负责调用AI模型的接口代码仅有约8000行,占比仅为1.6%。

AI Agent究竟在做什么?Claude Code 50万行代码泄漏全解析

剩下的98.4%代码分布在多个模块中:

  • 查询引擎(4.6万行):处理LLM API调用、流式输出、缓存编排和多轮对话管理。
  • 工具系统(2.9万行):定义了约40个内置工具和50个斜杠命令,形成类插件架构。
  • 终端UI渲染(2.5万行):包括一个长达5594行的print.ts文件。
  • 安全与权限控制(2万行):包含23项编号Bash安全检查和18个被屏蔽的Zsh内建命令。
  • 多代理编排系统(1.8万行):支持子任务分配和并行处理。

软件脚手架:Claude Code比网页版更强的核心原因

机器学习研究者Sebastian Raschka指出,Claude Code之所以比同模型的网页版表现更强,核心在于围绕模型构建的软件脚手架。这些脚手架包括:

  • 仓库上下文加载
  • 专用工具调度
  • 缓存策略
  • 子代理协作

他甚至认为,如果将这套工程架构套用到DeepSeek或Kimi等其他模型上,也能获得接近的编程性能提升。

每次缓存击穿,成本翻10倍

泄漏代码中的promptCacheBreakDetection.ts文件追踪了14种可能导致prompt cache失效的向量。为何Anthropic工程师如此重视缓存管理?

以Claude Opus 4.6为例,标准输入价格为每百万token 5美元,但如果命中缓存,读取价格仅为0.5美元,便宜90%。反之,每次缓存击穿都会使推理成本翻10倍。

AI Agent究竟在做什么?Claude Code 50万行代码泄漏全解析

泄漏代码中还存在一种叫cache_edits的机制,通过给旧消息打上“跳过”标记而非删除消息,确保缓存连续性不被破坏。这使得Claude Code能够支持无限长对话而不变慢。

44个开关:指向自主代理系统的未来

泄漏代码中隐藏了44个feature flags,其中最密集的是“自主代理”类(12个),指向名为KAIROS的系统。

KAIROS是一个常驻后台守护进程模式,能够在用户离开终端时主动执行任务,并在用户返回时切换回协作模式。

AI Agent究竟在做什么?Claude Code 50万行代码泄漏全解析

KAIROS还内置了autoDream子系统,定期启动“反思”流程,整理项目上下文,提升对项目的理解能力。

彩蛋:51.2万行代码里藏着一只电子宠物

在所有严肃的工程架构和安全机制之间,Anthropic的工程师还悄悄造了一套完整的虚拟宠物系统,内部代号BUDDY。

BUDDY是一只会以ASCII气泡框形式出现在用户输入框旁边的拟物化终端宠物,拥有18个物种和五项属性。它还能戴帽子,选项包括皇冠、礼帽、螺旋桨帽等。

据泄漏的上线计划,BUDDY原定于4月1日至7日开始内测,5月正式上线。

51.2万行代码,98.4%在做硬核工程,但最后有人花时间做了一只会戴螺旋桨帽的电子蝾螈。这或许才是泄漏里最人性化的那一行代码。