OpenAI推出新基准,评估AI模型在加密智能合约漏洞检测与修复方面的能力
OpenAI发布了一项新基准,用于评估不同AI模型在检测、修补甚至利用加密智能合约中发现的安全漏洞方面的表现。周三,OpenAI与加密投资公司Paradigm及加密安全公司OtterSec合作发布了《EVMbench:评估AI代理在智能合约安全上的表现》论文,旨在从理论上评估AI代理能从120个智能合约漏洞中利用多少资产。Anthropic的Claude Opus 4.6以平均“检测奖励”37,824美元位列榜首,OpenAI的OC-GPT-5.2和Google的Gemini 3 Pro分别以31,623美元和25,112美元紧随其后。
尽管AI代理在处理基础任务时效率日益提升,OpenAI指出,评估其在“具有经济意义的环境”中的表现正变得越来越重要。“智能合约保障着数十亿美元的资产,而AI代理很可能对攻击者和防御者都产生变革性影响。”OpenAI补充道:“我们预期基于代理的稳定币支付将增长,并有助于将其扎根于一个具有新兴实践重要性的领域。”
Circle首席执行官Jeremy Allaire曾于1月22日预测,数十亿AI代理将在五年内代表用户使用稳定币进行日常支付交易;前币安负责人赵长鹏(CZ)近期也指出,加密资产最终将成为“AI代理的原生货币”。测试AI代理在识别安全漏洞方面性能的需求日益凸显,因为攻击者在2025年窃取了价值34亿美元的加密资产,较2024年略有上升。
EVMbench基于40次智能合约审计中的120个精选漏洞
EVMbench借鉴了来自40次智能合约审计的120个精选漏洞,其中大部分来源于开源审计竞赛。OpenAI表示,希望该基准能帮助追踪AI在大规模识别和缓解智能合约漏洞方面的进展。
智能合约并非为人类设计:Dragonfly观点
Dragonfly管理合伙人Haseeb Qureshi周三在X平台上发文指出,加密技术取代产权和法律合约的承诺从未实现,并非因为技术失败,而是因为它从未为人类的直觉而设计。Qureshi表示,签署大额交易仍令人“感到恐惧”,尤其是面对抽血钱包和其他始终存在的威胁时,而银行转账很少引发同样的担忧。相反,他认为未来的加密交易将由AI中介的自主钱包促成,这些钱包将处理这些威胁并代表用户管理复杂操作:“一项技术往往在其补充要素最终出现时才真正到位。GPS不得不等待智能手机,TCP/IP不得不等待浏览器。对于加密技术,我们可能刚刚在AI代理中找到了它。”

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
索拉纳ETF
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注