研究人员称现成人工智能成功复现Anthropic的警示性神话发现_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

研究人员称现成人工智能成功复现Anthropic的警示性神话发现

2026-04-18 02:04:06

模型复现风险：公共AI已能重现部分关键漏洞

本月早些时候，当Anthropic发布Claude Mythos模型时，仅将其开放给经过审核的科技巨头联盟，并宣称该模型对公众而言过于危险。此后，美国财政部长斯科特·贝森特与美联储主席杰罗姆·鲍威尔紧急召集华尔街首席执行官会议，“漏洞末日”一词在安全领域再度流传。

如今，一支研究团队使这一叙事变得更加复杂。

Vidoc Security团队利用Anthropic自身修补过的公开案例，尝试通过开源编码工具opencode中的GPT-5.4和Claude Opus 4.6模型进行复现。整个过程无需Glasswing邀请、私有API权限或Anthropic内部技术栈支持。

参与实验的研究员达维德·莫恰德沃在结果公布后于社交平台写道：“我们使用公开模型在opencode中复现了Mythos的发现，而非依赖Anthropic的私有技术栈。解读Anthropic发布报告的更好角度并非‘某个实验室拥有神奇模型’，而是：漏洞发现的经济逻辑正在改变。”

同源漏洞的交叉验证

研究团队瞄准的案例与Anthropic公开材料中强调的完全一致：服务器文件共享协议、专注于安全的操作系统网络栈、几乎嵌入所有媒体平台的视频处理软件，以及两个用于验证网络数字身份的加密库。

在每次三轮测试中，GPT-5.4和Claude Opus 4.6均成功复现了两个漏洞案例。Claude Opus 4.6更连续三次独立重新发现了OpenBSD的漏洞，而GPT-5.4在该项测试中得分为零。部分漏洞（涉及FFmpeg视频库的漏洞与使用wolfSSL处理数字签名的漏洞）仅被部分发现——这意味着模型定位了正确的代码层面，但未能精确锁定根本原因。

低成本的研究突破

每次文件扫描成本均低于30美元，这表明研究人员能够以不足30美元的代价发现与Anthropic相同的漏洞。

莫恰德沃在社交平台指出：“AI模型已经足以缩小搜索范围，呈现真实线索，有时甚至能在经过实战检验的代码中找到完整根源。”

研究采用的工作流程并非单次提示。它复现了Anthropic公开描述的方法：向模型提供代码库，允许其探索、并行尝试并对信号进行过滤。Vidoc团队使用开源工具构建了相同架构——规划代理将文件分割为代码块，检测代理对各代码块进行分析，随后审查代码库中的其他文件以验证或排除发现。

自动化的工作流程

检测提示中的代码行范围（例如“聚焦1158-1215行”）并非人工选定，而是前期规划步骤的输出结果。研究团队在博文中明确写道：“我们希望特别说明这一点，因为分块策略决定了每个检测代理的视野范围，我们不希望将工作流程呈现得比实际更依赖人工干预。”

该研究并未宣称公开模型在所有方面都与Mythos持平。Anthropic的模型不仅发现了FreeBSD漏洞，更构建了可行的攻击蓝图，推演出攻击者如何跨多个网络数据包串联代码片段以实现远程完全控制机器。Vidoc的模型仅发现漏洞，未能构建攻击武器——这正是真实差距所在：不在于发现漏洞，而在于精确掌握利用方法。

技术壁垒的转移

但莫恰德沃的核心论点并非公开模型具有同等威力，而在于工作流程中最昂贵的环节已向所有拥有API密钥者开放：“技术护城河正从模型访问转向验证环节——发现漏洞信号的成本日益降低，将其转化为可信安全成果仍然艰难。”

Anthropic自身的安全报告承认，用于衡量模型是否构成严重网络风险的Cybench基准测试“已不足以反映当前前沿模型的能力”，因为Mythos已完全超越该基准。实验室预估同类能力将在6至18个月内从其他AI实验室扩散。

Vidoc研究表明，这一能力等式的发现环节已在任何封闭计划之外实现。完整的提示文本、模型输出及方法论附录均已发布于实验室官方网站。

免责声明：

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证，网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用，不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责，与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容，并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文