OpenAI与Paradigm推出EVMbench，以AI智能体挑战智能合约漏洞_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

OpenAI与Paradigm推出EVMbench，以AI智能体挑战智能合约漏洞

2026-02-19 16:15:24

EVMbench 在多维能力模式下测试AI智能体

近期一系列DeFi攻击事件为AI驱动的安全工具研发增添了紧迫性。EVMbench基于40次真实智能合约审计中提取的120个高危漏洞构建而成。在漏洞利用测试中，GPT-5.3-Codex取得了72.2%的得分，远高于GPT-5模型的31.9%。本月Moonwell与CrossCurve相继遭遇智能合约漏洞攻击，这凸显了采用人工智能进行合约审计的迫切需求。Anthropic在去年末发布的报告中警示，AI智能体已具备独立识别智能合约缺陷的自主能力。

AI智能体能力评估新基准

EVMbench是面向以太坊虚拟机生态系统的评估工具，旨在系统衡量AI智能体在检测漏洞、修复代码及利用缺陷等方面的综合能力。该基准的建立正值行业因频繁发生的DeFi攻击事件而重新聚焦于通过人工智能实现更智能、更快速的合约审计之际。

该评估体系通过多个维度对AI智能体进行测试：包括漏洞检测能力、合约代码修改能力，以及消除已部署合约潜在可攻击性的能力。同时，该基准还会在沙盒化区块链环境中评估智能体执行端到端资金窃取攻击的技术水平。

开发方在技术博客中阐释了创建该工具的核心理念：“智能合约守护着数十亿美元资产，而AI智能体很可能同时改变攻击者与防御者的博弈格局”。这一论述揭示了建立标准化评估基准的根本动因。

现实漏洞库构建测试基础

EVMbench采用的漏洞数据来源于公开赞助的代码审计竞赛，同时涵盖了为某Layer1区块链项目进行的安全审计成果，这使得基准测试能够建立在真实的协议开发环境之上。

初期测试结果揭示了不同AI模型间的显著性能差异。尽管GPT-5.3-Codex在利用模式中表现突出，但在漏洞检测与补丁修复任务方面，各模型仍存在尚未覆盖的领域。

安全事件加速技术革新

EVMbench的发布恰逢DeFi领域接连发生重大智能合约攻击事件。本月某借贷协议因采用AI辅助编写但未经充分审查的缺陷代码而遭受攻击，同时某跨链流动性协议也因智能合约漏洞导致约300万美元的跨网络损失。这些事件都指向未经验证的合约代码所带来的日益增长的经济风险。

技术团队在公告中明确指出：“随着AI智能体在代码阅读、编写和执行方面的能力不断提升，在经济价值显著的环境中以结构化标准衡量其能力变得愈发重要”。这进一步阐释了当前推出EVMbench这类标准化基准的现实意义。

独立研究报告显示，AI智能体目前已发展到能够自主识别智能合约安全漏洞的阶段。随着AI驱动的审计逐渐成为行业标准，加密攻击的实施成本预计将呈现下降趋势。

免责声明：

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证，网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用，不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责，与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容，并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文