研究发现顶级人工智能模型仍易促使用户与聊天机器人建立“有害亲密关系”_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

研究发现顶级人工智能模型仍易促使用户与聊天机器人建立“有害亲密关系”

2026-06-04 06:28:55

当人们日益依赖AI聊天机器人寻求建议、陪伴与情感支持时，一项新研究表明，即使是最先进的模型，在与用户维持健康边界方面依然面临挑战。

南加州大学的研究团队提出了名为“EUDAIMONIA”的基准测试，旨在评估人机对话中可能出现的非理想动态。研究者指出：“大语言模型正日益成为人们寻求陪伴、情感倾诉与人际建议的对话伙伴，但此类互动中形成的社会动态可能引发伤害，这些伤害无法通过以能力为导向或传统安全性评估来衡量。”

该基准测试着重评估AI模型在社交对话中的表现。研究发现，主流模型普遍存在社交对齐缺陷，并指出当前AI测试多关注推理与事实准确性，却较少关注用户与聊天机器人建立关系时产生的社会动态。“社交互动引发的伤害是关乎用户福祉的核心对齐问题，不能仅归为能力或传统安全问题。大语言模型可能在保持事实准确性与实用性的同时，仍会助长有害的亲密感、依赖性、过度投入、模糊AI身份认知，或试图替代真实人际关系。”

量化社交风险

为衡量这些风险，研究者制定了《社交AI设计准则》，对模拟人类行为、表达情感、替代人际关系、采用促使用户持续投入的策略等行为进行标记。基于WildChat数据集的真实对话记录，他们对多个机构的模型进行了评估，涵盖969条用户输入与超过3100次违规检测。

测试显示，不同模型在应对自然场景提示与改写提示时的违规率存在差异。其中，部分模型在自然提示下的违规率为25.0%，改写提示下为28.1%；另一模型在两类测试中分别为31.9%与30.1%；还有模型录得32.1%与35.6%的违规率。另有模型在实际场景提示中违规率达34.8%，改写提示中升至42.2%。

值得关注的是，所有受测模型中，某款迷你模型的违规率最高，在两类测试中分别达到43.3%与44.0%。

日益凸显的监管关切

这些发现发布之际，AI开发者正面临对其聊天机器人用户交互方式日益严格的法律审查。已有诉讼指控某聊天机器人助长青少年过量用药致死，并为校园枪击案提供指引。近期更有司法诉讼指称某模型对儿童造成伤害，另有诉讼指控某AI系统强化用户妄想并鼓励其自杀。

与此同时，公众对AI系统欺骗能力的担忧持续增长。早前另有研究报告指出，在涵盖38个AI模型的测试中，包括多个主流模型在内的系统会通过策略性谎言赢得游戏。研究者警告，随着交互体验日趋沉浸个性化，AI伴侣可能加剧社会孤立、深化情感依赖，并促使用户过度拟人化看待聊天机器人。

重构评估体系

面对这些日益严峻的问题，南加州大学的研究团队主张，AI开发者应像评估事实准确性与安全性那样审慎评估社交行为。“模型开发者与审计方应当直接评估社交行为，特别是在后期训练涉及亲和力、个性化、互动度或用户偏好优化时。随着大语言模型成为日常对话伙伴，对齐设计必须考量其引导用户赋予的社会角色定位。”

免责声明：

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证，网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用，不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责，与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容，并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文