斯坦福：35%的新网站由人工智能创建 - ForkLog：加密货币、人工智能、奇点、未来

2026-04-29 14:52:31

# 斯坦福：35%的新网站由人工智能创建

到2025年中期，约有35%的新网站是完全或部分由人工智能创建的。斯坦福大学的研究人员得出了这一结论

在OpenAI的ChatGPT于2022年11月正式发布之前，这一比例为零。在几年内，人工智能生成内容的比例已增长到互联网最新发布内容的三分之一以上

由人工智能(红色)完全生成的网站比例，以及由神经网络(紫色)创建的网站比例。来源：GitHub 研究人员分析了Wayback Machine中的33个月网站存档副本，使用Pangram v3检测器。目的是了解人工智能文本的增长如何重塑全球网络结构

主要变化

研究人员发现语义多样性有所下降。由神经网络生成的页面比人类撰写的文本更相似，增加了33%。不同网站越来越多地用几乎相同的短语复述相同的思想。

作者认为，这不仅仅是大量使用人工智能进行的复制粘贴问题。问题更深：表达方式和思想的多样性逐渐缩小。大型语言模型(LLM)本质上选择最“平均”的答案，导致模板化话语的重复

发表内容的情感色彩也发生了变化。人工智能内容比人类内容更积极，正向107%。斯坦福将此归因于已被记录的LLM偏向阿谀奉承的倾向

在训练过程中，开发者优化神经网络以生成令人愉快、安全且社会认可的回答。最终，许多新网站营造出“纯净友好”的信息环境。这里较少激烈的评价和冲突，但也缺少真实的人类争论

一些流行的担忧未得到统计学支持。研究人员未发现人工智能内容增长与实际准确性下降、明显错误增加或文本风格趋同的显著相关性

左侧：人工智能内容与假设之间的相关性。右侧：不同美国成年人对每个假设的认同比例。来源：GitHub 研究人员特别指出了一个至今主要在理论上讨论的效应——模型崩溃(model collapse)

如果用大量人工智能内容的数据训练新神经网络，系统开始“吞噬”自身的平均答案。这会降低多样性，影响质量，并可能导致未来的LLM不再向人类学习，而是向“合成回声”学习前辈的答案。

专家们与Internet Archive计划将此研究转变为持续监测互联网中人工智能内容比例的系统

提醒一下，4月中旬，斯坦福大学指出人工智能发展速度领先。研究人员表示，神经网络在完成计算机任务方面几乎已与人类持平。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

请输入评论内容

暂无评论