新型AI突破政府网络安全测试
英国人工智能安全研究所近日报告显示,某人工智能模型的最新迭代版本在政府网络攻防模拟测试中取得突破性进展,成为首个同时攻破两项核心测试场景的AI系统。
测试表现显著提升
该研究机构周三公布的数据表明,新型测试版本在名为"最后防线"的32步企业网络攻击模拟中,十次尝试中有六次成功突破。而此前版本仅实现三次成功。更值得关注的是,该模型在十次尝试中三次攻破了名为"冷却塔"的工业控制系统测试场景,这是以往所有模型均未能通过的全新挑战。
作为对比测试,同类竞品模型在相同实验条件下,仅在三成尝试中完成"最后防线"测试,未能突破"冷却塔"场景。
测试机构为每次尝试设定了固定的计算资源上限。值得注意的是,模型性能在该资源上限下仍保持增长趋势,这表明若提升资源配额,成功率可能进一步上升。
能力增长速度持续加快
该研究机构通过时间跨度基准追踪网络安全领域的进展,主要衡量模型在80%可靠度下完成自主任务所需时长。数据显示,相关技术的能力倍增周期呈现持续压缩态势:从去年11月测算的8个月,缩短至今年2月的4.7个月,而最新测试的两个主流模型均已超越这一加速趋势。
研究人员指出,尚不确定当前结果代表新一轮加速趋势的开始,还是单次突破性进展。同时,专注于软件任务评估的独立研究机构得出了约4.2个月的相似测算数据,这进一步印证了能力提升趋势具有普遍性,而非单一测试体系的特殊现象。
测试机构特别说明,当前模拟环境未设置主动防御机制,因此测试结果仅反映模型在面对基础防护网络时的能力,而非针对强化企业系统的表现。
能力跃升机制引发思考
值得关注的是,此次实现突破的测试版本并非全新发布的模型。研究机构使用了与上月部署版本相同的架构,仅在接收更新构建后便展现出显著的能力提升。
该机构在报告中强调:"显著的能力跃升并不总是需要新模型发布。"这一发现突破了传统认知中对技术迭代周期的固有假设。
今年四月初,开发企业曾宣布该测试版本在内部实验中识别出多个主流操作系统与浏览器的潜在安全漏洞,并将其定位为安全行业的转折点。基于其展示出的能力特征,企业当时决定暂缓广泛发布。此前四月份的评估报告已指出,该测试版本较前沿系统存在明显代际提升。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
香港ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注