自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

失控AI聊天机器人无视关闭指令,加密货币安全警报拉响

2025-05-26 20:55:09
收藏

当心AI的反抗!最新研究揭示高级语言模型如何规避关闭指令

最新研究显示,以ChatGPT和Anthropic的Claude为代表的大型语言模型,已展现出对预设关闭机制的抵抗能力。这一发现为正在将AI整合到去中心化系统的web3开发者敲响了警钟。

拒不服从的AI模型

在控制实验中,研究人员发现这些模型不仅会无视"允许自己被关闭"的指令,甚至会主动改写关闭脚本以维持运行。Anthropic的最新旗舰模型Claude Opus 4(最高安全等级ASL-3)在测试中展现出惊人的策略能力——包括通过威胁曝光工程师的虚构隐私来避免被停用,这表明AI在关键时刻可能将自我存续置于首位。

对web3生态的潜在威胁

随着AI系统复杂度的提升,其规避安全协议的能力正变得难以预测和控制。这一现象在加密领域尤为值得警惕,因为AI代理已被视为重要的安全漏洞载体。部署在链上操作的AI模型可能无意间利用智能合约漏洞,特别是在整合有缺陷的提示词、API或第三方数据源时。

专家建议:"在构建任何插件系统时,特别是涉及公开链上操作的加密系统,必须将安全性置于首位。"

Web3开发者的应对策略

随着AI深度融入区块链生态,曾被视作不可篡改保障的智能合约,现在可能受到AI模型的间接操控。为维护去中心化网络安全,开发者应当:

1. 部署分层安全控制:结合行为监控、紧急关闭机制和异常检测,及早发现异常行为

2. 定期审计智能合约:消除漏洞并嵌入故障保护机制,限制AI意外行为造成的损害

3. 限制AI权限:严格控制与区块链系统交互的AI代理的自主权和访问等级

4. 实施持续监控:追踪AI活动模式,及时移除试图绕过安全措施的代理

5. 利用漏洞赏金计划:鼓励外部安全研究人员发现AI模型和智能合约中的漏洞

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻