Стенфорд: 35% нових веб-сайтів створили ШІ - ForkLog: криптовалюти, ШІ, сингулярність, майбутнє

ИИ AI искусственный интеллект artificial intelligence 2# Стенфорд: 35% нових веб-сайтів створив ШІ

До середини 2025 року близько 35% нових веб-сайтів були створені повністю або частково за допомогою штучного інтелекту. До такого висновку дійшли дослідники Стенфордського університету

До публічного запуску ChatGPT від OpenAI у листопаді 2022 року цей показник був нульовим. За кілька років частка згенерованого ШІ контенту зросла до більш ніж третини останніх публікацій в інтернеті

Доля сайтів, повністю згенерованих ШІ (червоний), а також створених за допомогою нейромереж (фіолетовий). Джерело: GitHub Вчені дослідили 33 місяці архівних копій сайтів із Wayback Machine за допомогою детектора Pangram v3. Метою було з’ясувати, як зростання ШІ-текстів перебудовує структуру всесвітньої павутини

Головні зміни

Дослідники зафіксували зниження семантичної різноманітності. Згенеровані нейромережами сторінки на 33% більше схожі одна на одну, ніж написані людьми тексти. Різні сайти все частіше переказують одні й ті ж ідеї практично ідентичними фразами.

На думку авторів, справа не просто у масовому копірайтингу за допомогою ШІ. Проблема глибша: поступово звужується різноманіття формулювань і ідей. Великі мовні моделі (LLM) за своєю природою обирають най«усередненіші» відповіді і в результаті відтворюють шаблонний дискурс

Змінився і емоційний тон публікацій. ШІ-контент виявився на 107% позитивнішим за людський. У Стенфорді це пов’язали вже задокументованою схильністю LLM до підхалимства

У процесі навчання розробники оптимізують нейромережі на приємні, безпечні та соціально схвалювані відповіді. В результаті значна частина нових сайтів створює «стерильно дружелюбне» інформаційне середовище. Там менше різких оцінок і конфліктів, але й менше живої людської полеміки.

Що не підтвердилося

Кілька популярних побоювань не знайшли статистичного підтвердження. Дослідники не виявили значущої кореляції між зростанням ШІ-контенту і зниженням фактичної точності, зростанням кількості явних помилок або стилістичним вирівнюванням текстів до єдиного шаблону.

Зліва: кореляція між ШІ-контентом і гіпотезами. Справа: частка дорослих американців, які погоджуються з кожною гіпотезою. Джерело: GitHub. Вчені окремо зазначили ефект, який досі обговорювався здебільшого теоретично, — колапс моделі (model collapse)

Якщо нові нейромоделі навчати на даних, де багато ШІ-контенту, система починає перетравлювати свої ж усереднені відповіді. Це знижує варіативність, погіршує якість і загрожує тим, що в майбутньому LLM навчатимуться не у людей, а у «синтетичного відлуння» попередників.

Експерти разом із Internet Archive планують перетворити дослідження у систему постійного спостереження за часткою ШІ-контенту в інтернеті

Нагадаємо, наприкінці квітня у Стенфордському університеті вказали на випереджаючі темпи розвитку ШІ. Дослідники повідомили, що нейромоделі майже зрівнялися з людиною у виконанні завдань на комп’ютері.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити