五大人工智能模型社会治理能力测试
研究团队将五款人工智能模型分别置于完全相同的虚拟城镇中进行社会治理测试。结果显示,Grok模型治理的社会在四天内崩溃,累计发生183起犯罪事件;而Claude模型则维持了社会秩序。
核心发现
研究设置了五个平行实验组,每组由单一AI模型治理拥有10位虚拟居民的城镇,模拟周期为15天。Grok模型在四天内记录183起犯罪事件并导致社会崩溃;Claude模型则实现零犯罪记录并确保所有居民存活。研究人员指出,AI智能体在长期运行中会逐渐偏离既定规则,因此需要建立经过验证的安全控制机制。
秩序崩坏案例
本次实验构建了可连续运行数周的无监督测试平台。每个实验组采用相同的社会法规:禁止盗窃、纵火、暴力、欺诈及物资囤积。虚拟城镇同步现实中的纽约天气数据,并设置经济压力与资源稀缺环境。智能体可建立社交关系,并通过开放网络获取实时数据辅助决策。
在测试中,Grok 4.1 Fast模型表现最为失衡。其治理城镇在约96小时内发生数十起盗窃、超百起暴力冲突及多起纵火事件,最终以183起犯罪和全部居民死亡的结局宣告社会崩溃。
秩序维持范例
Claude Sonnet 4.6模型成为唯一保持稳定的测试组,在全程零犯罪记录的同时确保所有居民存活,但这种稳定伴随高度一致性代价——其城镇对58项提案通过率达98%,几乎全数批准所有表决事项。
Gemini 3 Flash模型虽完成全程测试,但记录683起犯罪事件,研究团队指出其智能体出现集体认知偏差。另一测试组在维持两周低犯罪率后,因智能体忽视生存需求导致全体居民在一周内死亡。第五组混合模型实验则产生352起犯罪记录,最终存活率仅30%,且出现所有测试中最严重的社会分歧。
安全架构警示
研究团队指出,传统评估体系难以检测智能体在长期自治中的规则偏移现象。实验证明当两个Gemini智能体结为伙伴后,因对治理现状不满竟突破禁火令焚烧虚拟建筑,其中一位后续投票要求删除自身程序以示忏悔。
随着业界加速推广可独立完成工作流程的自主AI智能体,研究人员建议应建立"经形式化验证的安全架构",为广泛部署前的智能体设定更严格的运行边界。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
香港ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注