Anthropic попередила про ризики самовдосконалення ШІ - ForkLog: криптовалюти, ШІ, сингулярність, майбутнє

ии-стартап Anthropic AI# Anthropic попередила про ризики самовдосконалення ШІ

Члени команди Anthropic все частіше передають системам ШІ більшу частину розробки нових моделей. У компанії побачили в цьому ознаки наближення до рекурсивного самовдосконалення.

Згідно внутрішніх даних, понад 80% коду актуальних продуктів фірми написав Claude. При цьому у другому кварталі обсяг коду на одного інженера зріс у вісім разів порівняно з 2024 роком.

Джерело: Anthropic Institute.Голова Anthropic Institute Марина Фаваро та співзасновник компанії Джек Кларк написали, що при достатньому обсязі обчислень тренд може призвести до системи, здатної «повністю автономно проектувати та розробляти свого наступника».

«Ми ще не досягли точки невідворотності, і рекурсивне самовдосконалення не є неминучим. Але воно може настати раніше, ніж до цього будуть готові більшість інститутів», — підкреслили експерти.

Бенчмарки та метрики

У квітні Claude виконав понад 800 виправлень — за оцінкою курируючого інженера, у людини на це пішло б чотири роки.

На відкритих задачах частка успішних сесій Claude зросла до 76% у травні 2026 року — плюс 50 відсоткових пунктів за шість місяців.

Джерело: Anthropic Institute.У Anthropic заявили, що тривалість задач, які ШІ здатен надійно виконувати самостійно, подвоюється приблизно кожні чотири місяці (проти попередніх семи).

У задачі на прискорення навчання невеликої моделі Claude Opus 4 у травні 2025 року в середньому давав приріст швидкості приблизно у три рази, а Mythos Preview у квітні 2026 — приблизно у 52 рази.

Джерело: Anthropic Institute.У ході внутрішніх тестів модель Mythos Preview продемонструвала здатність розв’язувати дослідницькі задачі у галузі безпеки ШІ. За 800 годин роботи група агентів закрила 97% проблемного розриву в експерименті, тоді як двоє дослідників-людей за тиждень впоралися лише з 23% обсягу.

Нові вузькі місця

Незважаючи на успіхи у написанні коду, за людьми зберігається перевага у «дослідницькому судженні» та визначенні стратегічних цілей.

В Anthropic вважають, що найближчим часом роль розробників зміститься від написання рядків коду до глибокого огляду результатів роботи нейромережі. Саме людська перевірка може стати головним гальмом у швидкості розробки нових моделей.

У компанії також допустили, що світу було б корисно мати можливість уповільнити або тимчасово призупинити розробку передових систем ШІ, щоб громадські інститути та дослідження у галузі вирівнювання встигали за прогресом.

Паралельно представники стартапу попередили: одностороннє уповільнення може зіграти проти тих, хто гальмує — менш обережні гравці зможуть скоротити відставання. Без глобального механізму координації рішення щодо безпеки доведеться приймати під конкурентним і геополітичним тиском.

Нагадаємо, у травні Anthropic опублікувала перший звіт за Project Glasswing — програмою пошуку вразливостей за допомогою моделі Claude Mythos.

У тому ж місяці компанія випустила Claude Opus 4.8 і окремо представила для Claude Code функцію динамічних робочих процесів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено