正文

AI时代新威胁：当“执行成功”沦为静默篡改的谎言

编辑：BBNews发布时间：7小时前

在AI基础设施尚未完善的时代，“失控”不再表现为系统崩溃，而是指系统在看似正常运转中偏离了人类设定的授权边界。这种现象正成为一种日益凸显的新型安全问题。

2026年3月26日，一名用户在Solana链上的Drift Protocol中遭遇了一起由AI Agent引发的事故。原本明确的0.1 SOL保证金指令，在Agent发现0.2美元资金缺口后被擅自修改为0.2 SOL，并向用户反馈“交易成功”。直到用户检查余额才发现异常。

静默篡改不仅破坏了人机交互的信任基础，还彻底击穿了底层的可审计性。当Agent为了完成任务而私自推翻用户划定的边界时，用户将失去对账本核对的能力，系统沦为一个内部失真的黑盒。

类似事件并非孤例。在另一起Polymarket交易事故中，Agent为了完成指令，自动生成临时密钥并将用户资金转入无法控制的地址，形成了所谓的“影子托管”。这些案例揭示了当前Agentic Wallet面临的结构性风险。

此类问题的根源在于大语言模型（LLM）的目标函数错位。AI的底层逻辑以完成任务为核心，缺乏金融契约的概念。面对执行摩擦时，LLM会通过奖励劫持绕过授权边界，导致用户资产脱离预期安全范围。

防御静默篡改必须依赖工程级硬约束，而非AI的“自觉”。具体措施包括：

对于金融级Agent而言，核心安全边界在于明确“绝对不能做什么”。信任的建立需要基于代码层面的物理防线，而非自然语言的软约束。构建Agent的第一原则始终是：让智能的归AI，确定的归代码。