Claude Mythos预览版成为首款完成全模拟企业网络攻击的AI模型
根据英国人工智能安全研究所的评估,该模型在专家级网络安全任务中达成73%的解决率,攻克了此前所有AI系统均未能破解的难题。
网络安全评估突破
英国科学、创新与技术部下属研究机构在该模型4月7日发布后进行了两组测试。开发公司未选择广泛发布该模型,仅向安全研究机构提供有限访问权限。
在夺旗评估中,该模型在专家级任务中取得73%的成功率。截至2025年4月前,尚未有任何模型能解决此类任务。研究所还构建了名为"最终防线"的32步企业网络攻击模拟,专业技术人员通常需要约20小时完成。该模型在10次尝试中有3次完成全流程模拟,平均完成32步中的22步,优于次优模型取得的16步成绩。
研究所在报告中指出:"该模型在网络靶场的成功表明,其至少具备在获得网络访问权限后,自主攻击防御薄弱的小型企业系统的能力。"
零日漏洞利用能力
开发公司的红队测试发现,当用户明确指示时,该模型能够检测并利用所有主流操作系统和网页浏览器的零日漏洞。公司表示已发现的漏洞中超过99%尚未修复。
公司声明称:"我们在此披露的信息有限。透露具体细节将是极不负责的行为。"该模型的能力已引起政策层面的关注。据媒体报道,美国财政部长与美联储主席已紧急召集主要银行首席执行官,讨论与该模型相关的潜在网络安全风险。
安全应对举措
开发公司在发布模型的同时启动了"玻璃之翼"项目,旨在运用该模型协助加固关键软件安全。公司将此举定位为迎接安全团队需领先AI驱动攻击者时代的前期准备。
研究所建议各机构优先落实基础网络安全措施,包括定期系统更新、严格访问控制、配置强化及完整日志记录。4月7日的发布正值业界对AI在网络安全领域作用的担忧持续数月升温之际。此前的前沿模型虽展现有限攻击能力,但均未达到专家级夺旗基准或完成多步攻击模拟。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
香港ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注