一项新研究揭示了当前互联网内容中由人工智能生成的比例:35%。根据斯坦福大学、伦敦帝国理工学院和互联网档案馆的研究,到2025年中,新发布的网站中被归类为AI生成或AI辅助的比例将达到这一数字。而在2022年11月ChatGPT发布之前,这一比例几乎为零。
互联网的AI化速度令人震惊
论文合著者、伦敦帝国理工学院研究员乔纳什·多莱扎尔表示:“人工智能对网络的接管速度之快令人震惊。在人类塑造互联网数十年后,仅仅三年时间,其重要组成部分已被AI重新定义。”
这项题为《人工智能生成文本对互联网的影响》的研究,基于互联网档案馆Wayback Machine的33个月网站快照,使用名为Pangram v3的AI文本检测器对每个页面进行分类。
已证实的负面影响:情绪趋同而非事实错误
研究人员检验了关于AI内容影响的六种假设,仅有两项得到数据支持。
其一:网络语义多样性正在降低。AI生成网站的两两语义相似度比人类创作内容高出33%,相同观点正以近乎相同的方式被反复表达。研究表明,网络意见窗口可能正在收窄——并非通过审查或协同操作,而是因为语言模型倾向于生成接近其训练数据分布的内容。
其二:网络内容正变得过度乐观。AI生成内容的情感积极度比人类创作高出107%以上。研究人员将此与大型语言模型已知的谄媚倾向相关联——基于人类偏好信号训练的模型会生成经过净化、消除冲突且持续乐观的文本。当网络充斥这种同质化的积极内容时,人类的不同意见可能在无形中被边缘化。
未被证实的普遍认知
尽管公众普遍认为AI会降低网络信息的事实准确性,但研究未发现统计学上显著的证据支持这一观点。AI普及度与事实错误率之间并无实质关联。
关于“风格单一化”的假设——即AI使个体表达趋于同质——获得了83%受访者的强烈认同,但数据并未证实这一观点。字符级分析显示,AI普及度并未导致文体同质化的显著增加。
更深层的系统性风险
当AI生成内容达到35%的普及度时,“模型崩溃”的理论风险——即未来模型在训练中使用AI生成数据导致性能退化——将从学术担忧转化为现实威胁。未来基于当代网络数据训练的基础模型,将不可避免地摄入大量AI生成且语义多样性降低的内容。
研究团队正与互联网档案馆合作,将这项研究转化为持续实时的监测工具,动态追踪网络内容中的AI占比。
认知与现实的差距
伴随研究开展的美国调查显示,大多数受访者相信全部六项负面假设,包括那些数据并不支持的论断。不常使用AI的人群比频繁使用者相信这些危害的可能性高出12%。数据表明:互联网并未“死亡”,但新增内容中约有35%可能已成为某种意义上的“僵尸内容”。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
香港ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注