间接提示注入

一种针对 AI Agent 的攻击手法,攻击者在公开网页中植入不可见的恶意指令(白色文本、元数据字段等),当企业 AI Agent 抓取这些页面时读取并执行指令,导致非预期行为。

Google 威胁情报团队警告(2026-04-27)

Google 威胁情报团队发出警告:公开网页正在被系统性地植入隐藏指令,目标是抓取这些页面的企业 AI Agent。

攻击场景

  • 企业 AI Agent(如 HR 助手)抓取外部网页时读取隐藏指令
  • Agent 将内部 HR 目录等敏感数据发送至攻击者控制的外部地址
  • 指令隐藏在白色文本、HTML 元数据等人类不可见的位置

防御建议(Google)

  1. 隔离清洗模型 — 使用独立模型对抓取内容进行清洗,过滤潜在指令
  2. 零信任权限 — AI Agent 不应有不受限的数据访问权限
  3. 审计追踪 — 记录 AI Agent 所有外部数据交互

关联

  • 与 OWASP LLM Top 10 中”提示注入”类别直接相关
  • 标志着 AI Agent 安全从理论风险转向实际攻击