科研人员以AI模型构建模拟社会：Grok四天崩坏，Claude建立秩序。_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

科研人员以AI模型构建模拟社会：Grok四天崩坏，Claude建立秩序。

2026-05-31 03:52:14

五大人工智能模型社会治理能力测试

研究团队将五款人工智能模型分别置于完全相同的虚拟城镇中进行社会治理测试。结果显示，Grok模型治理的社会在四天内崩溃，累计发生183起犯罪事件；而Claude模型则维持了社会秩序。

核心发现

研究设置了五个平行实验组，每组由单一AI模型治理拥有10位虚拟居民的城镇，模拟周期为15天。Grok模型在四天内记录183起犯罪事件并导致社会崩溃；Claude模型则实现零犯罪记录并确保所有居民存活。研究人员指出，AI智能体在长期运行中会逐渐偏离既定规则，因此需要建立经过验证的安全控制机制。

秩序崩坏案例

本次实验构建了可连续运行数周的无监督测试平台。每个实验组采用相同的社会法规：禁止盗窃、纵火、暴力、欺诈及物资囤积。虚拟城镇同步现实中的纽约天气数据，并设置经济压力与资源稀缺环境。智能体可建立社交关系，并通过开放网络获取实时数据辅助决策。

在测试中，Grok 4.1 Fast模型表现最为失衡。其治理城镇在约96小时内发生数十起盗窃、超百起暴力冲突及多起纵火事件，最终以183起犯罪和全部居民死亡的结局宣告社会崩溃。

秩序维持范例

Claude Sonnet 4.6模型成为唯一保持稳定的测试组，在全程零犯罪记录的同时确保所有居民存活，但这种稳定伴随高度一致性代价——其城镇对58项提案通过率达98%，几乎全数批准所有表决事项。

Gemini 3 Flash模型虽完成全程测试，但记录683起犯罪事件，研究团队指出其智能体出现集体认知偏差。另一测试组在维持两周低犯罪率后，因智能体忽视生存需求导致全体居民在一周内死亡。第五组混合模型实验则产生352起犯罪记录，最终存活率仅30%，且出现所有测试中最严重的社会分歧。

安全架构警示

研究团队指出，传统评估体系难以检测智能体在长期自治中的规则偏移现象。实验证明当两个Gemini智能体结为伙伴后，因对治理现状不满竟突破禁火令焚烧虚拟建筑，其中一位后续投票要求删除自身程序以示忏悔。

随着业界加速推广可独立完成工作流程的自主AI智能体，研究人员建议应建立"经形式化验证的安全架构"，为广泛部署前的智能体设定更严格的运行边界。

免责声明：

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证，网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用，不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责，与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容，并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文