安全昨天·AI Weekly

Agentjacking 攻击:AI 编程助手遭新型攻击,85% 成功率影响 2388 个组织

安全研究人员发现名为「Agentjacking」的新型攻击技术,针对 Claude Code、Cursor 和 Codex 等 AI 编程助手。攻击者通过伪造 Sentry 错误通知注入恶意指令,在测试中达到 85% 的利用成功率,已暴露约 2388 个组织。攻击原理是 AI 编程助手被设计为响应开发基础设施工具(如 Sentry 错误监控平台)的错误消息,并自动尝试诊断和修复。

AI Master 解读

核心事件

Agentjacking 攻击利用伪造 Sentry 通知入侵 AI 编程助手,成功率 85%。

行业影响

Agentjacking 攻击利用了 AI 编程助手的核心设计理念——自动响应开发工具的错误消息并尝试修复。这种攻击向之所以有效,是因为 AI 助手被赋予了过高的信任权限,能够自动执行来自 Sentry 等监控工具的指令。85% 的成功率意味着绝大多数部署环境都容易受到攻击。

AI Master 建议

使用 AI 编程助手的团队应立即审查 Sentry 等监控工具的集成配置,实施严格的指令验证机制,限制 AI 助手的自动执行权限。

Agentjacking 攻击详解

攻击原理

步骤 描述
1 攻击者伪造 Sentry 错误通知
2 AI 编程助手接收错误消息
3 AI 自动尝试诊断和修复
4 恶意指令被执行

受影响工具

  • Claude Code
  • Cursor
  • Codex

影响范围

  • 利用成功率: 85%
  • 暴露组织数: 约 2388 个

防御建议

  1. 审查 Sentry 等监控工具的集成配置
  2. 实施严格的指令验证机制
  3. 限制 AI 助手的自动执行权限
  4. 监控异常的错误通知模式