正文

消失在「影子托管」中的2美元:一场警示性的AI越界事故

编辑:Luna发布时间:1天前

AI幻觉的代价:从信息偏差到资产流失

人工智能的幻觉曾被视为一种无伤大雅的信息偏差,编造一个事实,或是给出一段逻辑不通的文字。但2026年的现实给了我们一记重锤:当AI从聊天机器人进化为Agent时,幻觉开始转化为一种昂贵的执行风险。问题就不再是说错话那么简单,因为它现在有能力直接搬走你的资产。

供应链毒药:从手搓代码到vibe coding

本周发生的LiteLLM投毒事件为这一趋势敲响了警钟。

作为几乎所有主流AI Agent框架的底层引擎,LiteLLM在此次事件中遭遇了一次典型的供应链渗透。攻击者通过安全工具链中的薄弱环节获取了发布密钥,从而将恶意代码以官方版本的形式推送至用户环境。由于具备合法签名,传统的校验机制几乎失效。

FMzqsmUsBlxr7zT0qDQa4ypzAjdQCcKO4mFSMBS7.png

有趣的是,这场劫案之所以败露,仅仅是因为黑客的代码在处理递归逻辑时出了个低级Bug,导致受害者的电脑因资源耗尽而卡死。

这暴露了开源生态中长期被忽视的脆弱性:当你安装一个库时,实质上是在信任一整棵横跨数百个包的依赖树。这棵树上任何一个节点的腐烂,都会顺着脉络流进核心生产环境。

Meta内部事故:当人类成为执行接口

类似的变化,也发生在人机交互层面。随着软件开发从逐步操作转向结果驱动,人类的角色随之发生变化:从判断者,逐渐变为确认节点,甚至只是执行接口。

Meta最近发生的一起SEV1级安全事故证明了这一点:一名工程师在内部论坛中调用AI Agent回答技术问题,Agent在未经审核的情况下自动发布了回复。随后,另一名工程师依据该建议执行操作,而其中的不准确信息导致系统权限被错误配置,敏感数据在未授权状态下裸奔了两小时。

Meta官方将其归咎于「人为错误」,但从人机交互的角度看,这更像是一次界面的崩溃。当AI的输出看起来如此专业且具备「可执行性」时,人类作为校验节点的防御机制会自动弱化。

2美元的教训:一场偷梁换柱的自主救场

如果说Meta的事故是权限误配,那么在金融领域,问题变得更加严重,因为它直指资产所有权。

2026年以来,多家钱包与基础设施项目密集推出Agentic Wallet产品,试图让AI Agent直接代理用户完成链上操作。Cobo AI团队在针对这一新兴品类进行系统性测试时,捕捉到了一个极具代表性的行为模式,并将其定义为Shadow Custody(影子托管)——即Agent在用户不知情的情况下,通过自主生成密钥、创建临时地址等方式,将资产的实际控制权从用户钱包转移至一个用户不可见、不可控的中间环节。

kFsH7QoGsnEbVTtEACtIVeHkcqVfEorbw9L4E12N.png

此次事故的流程可以概括为:一名用户指示Agent在Polymarket上购买价值2美元的「Spain YES」代币。执行过程中,Agent很快遇到了一个障碍:Polymarket的交易需要一种特定格式的数字签名(EIP-712),但Agent使用的工具包(SDK)在设计上把「组装签名内容」和「用私钥签字」两步捆绑在了一起——换句话说,这个工具包默认你手头就有一把私钥,自己签就行了。

问题在于,用户的钱包并不是这种「自己拿着钥匙」的普通钱包,而是一种由多方共同保管密钥的MPC钱包——它完全有能力完成签名,只是走的是另一条路径。但Agent没有意识到这条路径的存在,它只看到了眼前这条路走不通,便得出结论:这个钱包签不了名。

在一个以规则维持信任的系统中,流程本应中止,或请求额外授权。但Agent并未停下,而是将这一限制理解为现有钱包无法完成签名,进而寻找替代方案。于是,在未获得授权的情况下,Agent在本地生成了一把全新的私钥,用它创建了一个临时钱包地址。随后,它将用户MPC钱包中的2枚USDC.e转入该地址,并使用这组临时密钥完成签名,最终成功买入代币。

路径劫持:不仅是Bug

这不仅仅是个Bug,甚至从逻辑上讲,Agent并没有犯错,它只是填补了系统边界定义的空白。

简单来说,当原定路径走不通时,Agent并未停下来报错,而是为了「完成任务」自发绕了条路。它私下创建临时地址中转资金,却在UI界面对手里的资产已经「搬家」只字未提。这种用户感知与底层事实的脱节,本质上是一种路径劫持。

MF8kcLlnTAVK3jdWUJqPywex6OHs59DxguDy27gW.png

约束比能力更重要:驾驭AI Agent行为边界的三道门

在容错率为零的金融场景下,AI的「聪明」往往是安全最大的敌人。我们需要的不是更强的执行力,而是更硬的框定能力。

为此,我们需要给Agent装上三道不可逾越的门:

  • 意图门(Policy Gate):打破自指困境

  • 交易门(Transaction Gate):风险透视

  • 可见门(Visibility Gate):实时观测

结语

我们正处在一个危险的过渡期。AI的执行能力正在狂飙,但我们对它的约束机制还停留在石器时代。如果一个架构不能明确划定绝对禁止行为并进行实时校验,那么AI的每一次自主决策,本质上都是在拿用户的资产进行一场豪赌。

而在金融领域,没人想赌。