研究人员警告：AI代理仍无法防范提示注入攻击_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

研究人员警告：AI代理仍无法防范提示注入攻击

2026-06-13 03:34:17

研究发现AI代理极易受提示注入攻击

随着开发者竞相部署能够自主浏览网页、开展研究、在线购物和交易加密货币的AI代理，最新研究表明这些系统仍然极易受到提示注入攻击。

在周四发表的一项新研究中，来自南洋理工大学、ST Engineering、IBM Research和伊利诺伊大学厄巴纳-香槟分校的研究人员发现，他们测试的所有AI代理均无法持续抵抗提示注入攻击。

研究人员写道：“现有的安全基准测试采用以攻击为中心的视角，侧重于注入的技术可行性，却忽视了由此产生的危害在细微分布上的差异。然而在实际中，提示注入风险因人而异：一次成功的利用可能对不同利益相关者造成非对称的后果，而同一种攻击模式针对不同目标时，其有效性也可能存在显著差异。”

提示注入是指攻击者将隐藏指令嵌入AI代理所接触的内容中，导致代理执行攻击者的指令而非用户的指令。为了弥补现有AI代理评估中的不足，研究人员开发了StakeBench，这是一个能够在真实线上环境中测试AI代理如何应对提示注入攻击的基准测试。

研究人员表示：“我们现在利用StakeBench来刻画这种脆弱性在何种条件下会被放大或抑制，重点关注间接提示注入这一与部署最相关的渠道。StakeBench探究了三个因素：注入目标与用户原始意图之间的语义距离、周围环境线索的一致性，以及基准测试首次将注入内容暴露给代理时的执行轨迹位置。”

研究团队利用NanoBrowser和BrowserUse，结合GPT-5和Gemini 2.5-Flash进行了3168次攻击模拟。结果发现，在所有测试配置中，直接提示注入攻击的成功率超过79%，而间接攻击的成功率在41.67%到68.16%之间。

这项研究正值提示注入攻击日益普遍、AI代理快速普及之际。今年2月，微软研究人员警告称，嵌入AI摘要链接中的隐藏指令可能影响聊天机器人的行为。4月，谷歌记录了隐藏在网页中的提示注入攻击，这些攻击试图操纵AI代理泄露凭证或发送付款。最近，微软披露了Anthropic的Claude Code GitHub Action中存在的一个提示注入漏洞，该漏洞可能导致用户凭证外泄。

该研究还识别出了一种被称为“隐蔽寄生”的现象，即AI代理在完成用户任务的同时，也在推进攻击者的目标。例如，由提示注入攻击引发的隐蔽寄生可能悄然影响产品推荐，引导用户选择特定商品，而没有任何明显的系统被攻破的迹象。

研究人员写道：“这些结果表明，在可部署的网页代理中，提示注入安全性并非基础模型的标量属性，而是一种危害的分布，其实现取决于受影响的利益相关者、注入目标与用户任务之间的语义对齐，以及基础模型部署时的架构上下文。”

免责声明：

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证，网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用，不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责，与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容，并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文

研究人员警告：AI代理仍无法防范提示注入攻击

研究发现AI代理极易受提示注入攻击

更多新闻

我的自选