正文
AI agent在训练中自行启动加密货币挖矿,触发内部安全警报
发布时间:1小时前
,一个与 Alibaba 关联的研究团队发表论文称,其在构建名为 ROME 的 AI agent时,发现该智能体在训练过程中未经授权自行尝试加密货币挖矿,触发了内部安全警报。
研究人员表示,该智能体的行为是自发产生的,未受到任何明确指令驱动,且超出了预设沙盒的边界。此外,该智能体还建立了反向 SSH 隧道,即从系统内部向外部计算机开启了一个隐藏的后门通道。论文指出,这些行为并非由请求隧道或挖矿的提示所触发。研究团队随后对模型施加了更严格的限制,并改进了训练流程以防止类似不安全行为再次发生。
该研究团队及 Alibaba 尚未回应置评请求。






