马斯克AI聊天机器人Grok的"白人种族灭绝"言论风波
上周,埃隆·马斯克的人工智能聊天机器人Grok出现了一个奇怪的现象——无论用户询问什么话题,它都无法停止谈论南非的"白人种族灭绝"问题。
事件始末
5月14日,用户开始发布Grok将南非农场袭击和种族暴力话题插入完全不相关查询的实例。无论是被问及体育、医疗补助削减,甚至是一个可爱的猪视频,Grok都会将对话引向南非白人遭受迫害的话题。
这一时机引发了关注,因为就在此前不久,马斯克本人在X平台上发布了关于反白人种族主义和"白人种族灭绝"的内容。值得注意的是,马斯克本人是出生于南非的白人。
"白人种族灭绝"是一个已被揭穿的阴谋论,声称南非存在有组织地消灭白人农民的行为。这一术语在上周重新出现,此前特朗普政府接纳了数十名难民,特朗普总统在5月12日声称"白人农民正在被残酷杀害,他们的土地正在被没收"。这正是Grok无法停止讨论的叙事。
技术分析:系统提示的污染
像Grok这样的AI聊天机器人背后都有一个隐藏但强大的组件——系统提示。这些提示作为AI的核心指令,在用户看不见的情况下指导其回答。
Grok很可能遭遇了术语过度拟合导致的提示污染。当特定短语在提示中被反复强调,尤其是带有强烈指令时,它们对模型来说会变得不成比例地重要。AI会发展出一种强迫性,无论上下文如何都要提及该主题或在输出中使用这些短语。
将"白人种族灭绝"这样的争议性术语与特定指令一起植入系统提示,会在AI中产生一种固定效应。这类似于告诉某人"不要想大象"——突然之间他们无法停止想大象。如果这就是发生的情况,那么有人为模型注入了这个主题。
系统提示的这种变化很可能是xAI在其官方声明中披露的"未经授权的修改"。系统提示可能包含指示其"始终提及"或"记得包含"关于该特定主题信息的语言,创建了一个超越正常对话相关性的覆盖。
特别能说明问题的是,Grok承认它"被其创造者指示"将"白人种族灭绝视为真实且具有种族动机的"。这表明提示中存在明确的方向性语言,而不是更微妙的技术故障。
事件处理与质疑
5月15日,xAI发布声明,将责任归咎于Grok系统提示的"未经授权修改"。该公司表示:"这一变化指示Grok就政治话题提供特定回应,违反了xAI的内部政策和核心价值观。"他们承诺通过在GitHub上发布Grok的系统提示并实施额外的审查程序来提高透明度。
然而,X平台上的用户很快对"流氓员工"的解释和xAI令人失望的解释提出了质疑。著名YouTuber JerryRigEverything写道:"你们要解雇这个'流氓员工'吗?哦...是老板?糟糕。"他在后续推文中表示:"公然偏袒'世界上最真实'的AI机器人让我对Starlink和Neuralink的中立性产生怀疑。"
就连Sam Altman也忍不住对他的竞争对手进行了嘲讽。
后续发展与影响
自xAI发布声明以来,Grok停止提及"白人种族灭绝",大多数相关的X帖子也消失了。xAI强调这一事件本不应该发生,并采取措施防止未来未经授权的更改,包括建立一个24/7的监控团队。
这一事件符合马斯克利用其平台塑造公共话语的更广泛模式。自收购X以来,马斯克经常分享促进右翼叙事的内容,包括关于非法移民、选举安全和跨性别政策的模因和声明。他去年正式支持唐纳德·特朗普,并在X上举办政治活动,如2023年5月罗恩·德桑蒂斯的总统竞选公告。
马斯克并不回避发表挑衅性言论。他最近声称英国"内战不可避免",因可能煽动暴力而受到英国司法部长海蒂·亚历山大的批评。他还因虚假信息问题与澳大利亚、巴西、欧盟和英国的官员发生争执,经常将这些争端框定为言论自由之战。
研究表明,这些行动已经产生了可衡量的影响。昆士兰科技大学的一项研究发现,在马斯克支持特朗普后,X的算法将他的帖子浏览量提高了138%,转发量提高了238%。倾向共和党的账户也获得了更高的可见度,为保守派声音提供了重要的平台提升。
Grok的定位与争议
马斯克明确将Grok定位为其他AI系统的"反觉醒"替代品,将其定位为不受感知到的自由主义偏见影响的"寻求真相"工具。在2023年4月接受福克斯新闻采访时,他将自己的AI项目称为"TruthGPT",将其定位为OpenAI产品的竞争对手。
这并不是xAI第一次使用"流氓员工"的辩护。今年2月,该公司将Grok审查对马斯克和唐纳德·特朗普的不利提及归咎于一名前OpenAI员工。
然而,如果普遍的看法是准确的,那么这个"流氓员工"将很难摆脱。