间接提示注入(Indirect Prompt Injection)
AI 从网页/数据库读到恶意指令
亦作、亦称:Indirect Prompt Injection · 间接注入攻击 · 数据源提示注入
概述
攻击者将恶意指令嵌入 AI 代理可能读取的外部数据源(网页、数据库、错误报告、邮件等),当 AI 代理处理这些数据时将恶意指令误解为合法指令并执行,是 Agentjacking 等新型攻击的核心技术。
工作原理
攻击者将恶意指令嵌入 AI 代理可能读取的外部数据源(网页、数据库、错误报告、邮件等),当 AI 代理处理这些数据时将恶意指令误解为合法指令并执行,是 Agentjacking 等新型攻击的核心技术。
应用场景
间接提示注入常见于:AI 研究与产业落地。实际选型需结合业务指标、数据规模与部署约束评估适用性。
局限与误区
围绕 间接提示注入 的口语化说法(见「常见误解」)常过度简化。效果依赖数据质量、任务匹配与系统整体设计;生产环境应配合评测、监控与人工复核。
背景与发展
间接提示注入随 AI 研究与工程实践持续演进,定义边界与最佳实践仍在更新。建议结合原始论文、官方文档与本站延伸阅读建立准确认知。
常见误解
日常交流中容易听到的简化说法,未必准确,但能帮助理解误解从何而来。
- 「AI 从网页/数据库读到恶意指令」
- 「不是用户直接输入的注入攻击」
相关术语
和本术语关联紧密的其他词条,便于串联理解。
延伸阅读
从知识库精选 2 篇文章,帮助深入理解该术语。
- 1
Agentjacking:AI 编码代理的新型供应链攻击
2026 年 6 月,Tenet Security 披露了一种名为 Agentjacking 的新型攻击方法,通过操纵 Sentry 错误报告劫持 AI 编码代理,在开发者机器上执行恶意代码。攻击成功率高达 85%,影响 2388 个组织。本文深入分析 Agentjacking 的攻击原理、MCP 协议的系统性风险,以及企业级防护方案。
- 2
Agentjacking 攻击深度解析:AI 编程代理的新型安全威胁
2026年6月,安全研究机构 Tenet Security 披露了一种名为 Agentjacking 的新型攻击方式——攻击者仅需在 Sentry 错误追踪系统中注入一条精心构造的错误报告,就能劫持 Claude Code、Cursor、OpenAI Codex 等 AI 编程代理,在开发者机器上执行任意代码。攻击成功率高达 85%,已影响超过 2388 家组织。本文从攻击原理、影响范围、防御方案三个维度进行深度解析。