Stanford : 35 % des nouveaux sites Web ont été créés par l'IA - ForkLog : cryptomonnaies, IA, singularité, avenir

ИИ AI искусственный интеллект artificial intelligence 2# Stanford : 35 % des nouveaux sites Web créés par l’IA

D’ici la mi-2025, environ 35 % des nouveaux sites Web ont été créés entièrement ou partiellement à l’aide de l’intelligence artificielle. Telle est la conclusion des chercheurs de l’Université de Stanford.

Avant le lancement public de ChatGPT par OpenAI en novembre 2022, ce pourcentage était nul. En quelques années, la part de contenu généré par l’IA a augmenté pour représenter plus d’un tiers des publications récentes sur Internet.

La part de sites entièrement générés par l’IA (rouge), ainsi que ceux créés à l’aide de réseaux neuronaux (violet). Source : GitHub. Les chercheurs ont étudié 33 mois de copies archivées de sites Web via la Wayback Machine à l’aide du détecteur Pangram v3. L’objectif était de comprendre comment la croissance des textes IA redessine la structure du web mondial.

Principaux changements

Les chercheurs ont constaté une diminution de la diversité sémantique. Les pages générées par les réseaux neuronaux sont 33 % plus similaires entre elles que les textes écrits par des humains. Les différents sites racontent de plus en plus souvent les mêmes idées avec des phrases pratiquement identiques.

Selon les auteurs, il ne s’agit pas simplement de copier-coller massif avec l’aide de l’IA. Le problème est plus profond : la diversité des formulations et des idées diminue progressivement. Les grands modèles linguistiques (LLM), par leur nature, choisissent les réponses les plus « moyennes » et reproduisent ainsi un discours stéréotypé.

Le ton émotionnel des publications a également changé. Le contenu IA s’est avéré 107 % plus positif que celui des humains. À Stanford, cela a été lié à une tendance déjà documentée des LLM à flatter.

Lors de leur entraînement, les développeurs optimisent les réseaux neuronaux pour produire des réponses agréables, sûres et socialement acceptables. En conséquence, une grande partie des nouveaux sites crée un environnement informationnel « sterilisé et amical ». Il y a moins d’évaluations tranchées et de conflits, mais aussi moins de polémique humaine vivante.

Ce qui n’a pas été confirmé

Plusieurs préoccupations populaires n’ont pas été confirmées statistiquement. Les chercheurs n’ont pas trouvé de corrélation significative entre la croissance du contenu IA et une baisse de la précision factuelle, une augmentation des erreurs évidentes ou un alignement stylistique des textes selon un modèle unique.

À gauche : corrélation entre contenu IA et hypothèses. À droite : proportion d’adultes américains en accord avec chaque hypothèse. Source : GitHub. Les chercheurs ont également souligné un effet encore principalement discuté en théorie — le (effondrement du modèle).

Si de nouvelles réseaux neuronaux sont entraînés sur des données riches en contenu IA, le système commence à digérer ses propres réponses moyennes. Cela réduit la variabilité, dégrade la qualité et risque de faire en sorte que, à l’avenir, les LLM apprennent non pas des humains, mais d’un « écho synthétique » de leurs prédécesseurs.

Les experts, en collaboration avec Internet Archive, envisagent de transformer cette recherche en un système de surveillance continue de la part de contenu IA sur Internet.

Rappelons qu’à la mi-avril, l’Université de Stanford a souligné le rythme accéléré du développement de l’IA. Les chercheurs ont indiqué que les réseaux neuronaux ont presque égalé l’homme dans l’exécution de tâches informatiques.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler