Openai推出新型ai代理基准测试,评估加密智能合约安全能力
鉴于智能合约中锁定的巨额资金规模,此次尝试旨在衡量ai在攻击者与防御者双方可能扮演的角色,因而备受关注。Openai于当地时间18日与加密货币投资公司Paradigm及安全机构Ottersec联合发布了研究报告《EVMbench:智能合约安全中的ai代理评估》。该基准测试的特色在于,从总计40次智能合约审计中筛选出120个漏洞,从"经济绩效"角度对每个ai模型理论上能窃取(或保护)多少资产进行量化评分。
评估结果显示,Anthropic的"Claude Opus 4.6"以平均37,824美元的"检测奖金"位居第一。随后是Openai的"OC-GPT-5.2"(31,623美元)和Google的"Gemini 3 Pro"(25,112美元)。检测奖金是指假设发现并阻止了漏洞利用后,理论上可"挽救的资产价值"折算成美元的指标。
EVMbench的核心在于将ai不仅视为简单的代码助手,更是影响实际经济活动的"代理"。Openai在报告中强调:"随着ai代理执行的任务日益复杂,在'具有经济意义的环境'中评估它们变得至关重要。"智能合约是管理去中心化金融、链上游戏、衍生品等多个领域"数十亿美元"规模资产的基础设施。Openai指出:"智能合约保护着数十亿美元的资产,而ai代理可能成为攻击者和防御者的转折点。"
公司特别预测,未来"基于代理的稳定币支付"将大幅增长。解释称,ai代理将自主执行稳定币支付,作为经济活动的主体参与其中,而智能合约安全则是其基础。
量化评估的现实背景与测试方法
Openai试图量化"代理型ai"的智能合约安全能力,其背景是黑客攻击造成的损失难以减少的现实。根据各类链上数据和安全报告,仅2025年一年,攻击者窃取的加密资产就高达约34亿美元。虽然同比仅小幅增长,但规模本身仍然巨大。
EVMbench正是在这种环境下,衡量ai能够"多快、在何种程度上"捕捉漏洞,并提出补丁方案或构建攻击场景。120个漏洞大多选自开源审计竞赛和漏洞赏金案例,其意义在于这些问题已在实战中出现或具有同等难度。Openai通过研究表示:"希望EVMbench成为长期追踪ai在智能合约漏洞检测与缓解领域发展速度的基准。"并期待其最终有助于提升大规模链上系统的整体安全性。
ai代理与加密货币结合引发的讨论
这项研究也再次引发了关于ai代理与加密货币交汇点的争论。风险投资公司Dragonfly的管理合伙人哈西布·库雷希同日发文,谈及了智能合约与传统金融在使用体验上的差异。他分析道:"加密货币取代财产权与法律合约的承诺尚未实现。这不是技术失败,而是因为它未能按照人类直觉进行设计。"他坦言,每当需要批准价值数百万美元的链上交易时,"钱包盗取攻击"等各种威胁仍会掠过脑海,与银行转账同等金额相比,感受到的不安要大得多。
相反,他预测未来的加密货币使用体验将演变为"ai中介的自主钱包"形式,而非人类直接签名。这些钱包将代表用户自动识别和处理网络钓鱼、恶意智能合约、过高Gas费、复杂的DeFi策略等,必要时还会捆绑执行多笔交易,扮演"管理者"角色。库雷希以链上代理实验平台"Moltbook"为例,说明:"虽然目前处于非常原始的阶段,但已经可以看到代理们试图寻找相互支付的方式。"这意味着,非人类的ai代理之间委托任务并用加密货币结算报酬的架构正在萌芽。
他进一步指出:"许多技术是在'互补品'出现后才找到自身定位的。GPS需要等待智能手机,TCP/IP需要等待网络浏览器。对于加密货币,其互补品可能会在ai代理中找到。"这种观点认为,智能合约对人类而言仍是陌生且具有威胁性的接口,但对ai代理而言,却可能成为易于机械解读和执行的'自然环境'。
ai在安全领域的双重角色与未来展望
EVMbench同时揭示了围绕ai与智能合约安全的两面性。一方面,卓越的ai代理可能被滥用于比以往更精密的攻击工具;另一方面,同样的技术也能扮演保护大规模链上系统的"自动防火墙"角色。这项研究与其说直接影响当前的投资判断,不如说有助于展望未来加密基础设施与ai技术结合后将如何展开"规模游戏"。智能合约管理的资产规模越大,针对它的攻击和防御对ai的依赖度都可能越高。
最终,市场应关注的焦点并非简单地看"哪个模型更擅长发现漏洞",而在于此类基准测试如何融入智能合约的设计、审计、运维全过程,从而切实降低风险。如果ai代理与加密货币成为彼此的"互补品",那么智能合约生态的安全范式本身或将重构。
智能合约安全新时代与投资者的应对之策
ai正在进入发现、修复甚至利用智能合约漏洞的时代。如今,链上基础设施正迅速演变为一个由数十亿ai代理相互交换资产的巨大自动化经济体,而不再是人类直接承担所有风险的领域。问题在于,如果未能理解这个复杂结构,仅凭"收益率"就贸然进入,就可能像2025年那34亿美元被盗事件一样,成为下一个受害者。将资产委托于何种智能合约,信任何种DeFi策略和代理钱包——建立这些判断标准,将成为未来投资者最重要的生存技能。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
索拉纳ETF
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注