• 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

OpenAI与Paradigm联合推出以太坊安全测试工具EVMbench

2026-02-19 17:45:00
收藏

OpenAI与Paradigm基于真实审计漏洞构建EVMbench评测框架

OpenAI与Paradigm合作推出全新基准测试工具EVMbench,旨在通过沙盒化EVM环境评估人工智能在漏洞检测、修复及利用三种模式下的表现。最新测试数据显示,GPT-5.3-Codex在攻击利用模式下获得72.2%的得分,显著超越早期发布的GPT-5模型性能。

基于真实审计案例构建测试集

该基准测试汇集了来自40项专业智能合约审计中发现的120个高危漏洞,其中多数案例来源于公开审计竞赛。数据集特别纳入与稳定币支付链Tempo相关的安全场景,重点关注支付逻辑风险。开发团队在构建过程中复用已有的攻击验证脚本,同时对缺失环节进行手工补全,在确保漏洞可利用性的同时保持修复方案的可编译性。

三重测试模式评估智能体能力

EVMbench通过检测、修复、利用三种模式对AI智能体进行全方位评估:检测模式要求智能体扫描代码库并基于漏洞召回率评分;修复模式需在保持合约原有功能的前提下完成漏洞修补;利用模式则模拟沙盒区块链环境中的资金窃取攻击。测试采用基于Rust的确定性部署框架,通过交易回放与链状态验证确保结果一致性。

所有测试均在本地Anvil环境中运行,涵盖的漏洞均为已公开的历史案例。测试框架通过限制不安全RPC调用防范潜在滥用风险。当前结果显示,虽然GPT-5.3-Codex在攻击利用方面表现突出,但AI在漏洞检测与修复覆盖度方面仍有提升空间。

团队强化与未来展望

随着该项目推进,OpenAI宣布迎来重要团队成员加入。OpenClaw创始人彼得·斯坦伯格将主导新一代个人智能体项目的研发工作,公司联合创始人山姆·阿尔特曼通过社交媒体确认了这一人事任命。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻
自选
我的自选
查看全部
市值 价格 24h%