Звіт Anthropic відповідає самовдосконаленню: вже пройдено часткове замкнуте коло, але до повністю автономного навчання ще далеко

robot
Генерація анотацій у процесі
Згідно з моніторингом Beating, здатність AI до самостійної ітерації перевищує всі очікування. Інститут Anthropic (The Anthropic Institute) 5 червня опублікував доповідь «Коли AI створює себе сам», у якій детально розкрито їхній прогрес у галузі «рекурсивного самовдосконалення». Дані свідчать, що станом на травень 2026 року, понад 80% коду, об’єднаного у головний репозиторій Anthropic, написано самим Claude. А перед випуском Claude Code у лютому 2025 року, код, написаний Claude, займав лише кілька відсотків. Засновник AI-компанії Zhīpǔ, Тан Цзе, 13 травня передбачив, що кінцева мета великих моделей — самовдосконалення, і, ймовірно, Claude вже пройшов базовий рівень самонавчання «писати код, очищати дані, тренувати себе». Однак у доповіді Anthropic чітко зазначено, що повністю автономне проектування та розробка наступників через рекурсивне самовдосконалення ще не реалізовані. Роль AI у ланцюжку розробки наразі переходить від часткової підвищення ефективності до автономних рішень. У другому кварталі 2026 року середньодобовий обсяг коду, об’єднаного інженерами Anthropic, досяг у 8 разів більше, ніж у 2024 році. Поточний процес розробки дуже простий: інженери відповідають за планування цілей і рецензію, а Claude — за конкретне написання та запуск. Також Anthropic запровадила Claude як автоматичного рецензента коду, який перехоплює баги та вразливості безпеки. Це свідчить про те, що опора на «самооцінку» вже реалізована у технічному процесі, але людський контроль залишається останнім бар’єром безпеки. Надійність виконання довгострокових завдань моделлю також зросла у два рази. Тривалість автономної роботи моделі збільшується приблизно у 4 рази кожні 4 місяці. У березні 2024 року Claude 3 Opus міг виконувати прості завдання тривалістю 4 хвилини. Через рік Claude 3.7 Sonnet вже міг працювати 1,5 години. До березня 2026 року Claude 4.6 Opus міг справлятися із складними завданнями тривалістю 12 годин. За даними оцінювальної організації METR, остання версія Claude Mythos у режимі попереднього перегляду може автономно працювати понад 16 годин, наближаючись до межі сучасних інструментів оцінки. За поточними темпами, до 2027 року AI зможе самостійно виконувати дослідницькі завдання, що раніше вимагали тижнів людської праці, допомагаючи компаніям перейти від «одинокої компанії» до «безлюдної компанії». Що стосується здогадок Тан Цзе про «базу самонавчання», доповідь фактично розкриває локальний «міні-експериментальний цикл». У дослідженнях прискорення тренування малих моделей у травні 2025 року Claude 4 Opus міг збільшити швидкість кодування у 3 рази, тоді як у квітні 2026 року версія Claude Mythos досягла 52-кратного прискорення. Для порівняння, провідні людські дослідники зазвичай досягають 4-кратного підвищення за 4-8 годин. Однак цілі та критерії успіху експериментів заздалегідь визначаються людьми. При переході до більш складних кінцевих автоматичних процесів «очищення даних, генерація синтетичних даних і самонавчання» модель все ще позбавлена необхідних для прийняття рішень навичок. Водночас автономна замикаюча ланцюг розробки підштовхує людство до межі втрати системного контролю. Передбачення Тан Цзе про «заміну традиційної архітектури LLM OS та застосунків, що генеруються за запитом», означає, що у майбутньому всі обчислювальні процеси будуть базуватися на динамічному коді, який неможливо попередньо перевірити; а попередження Anthropic про «відставання людського контролю від самовдосконалення AI» означає, що ми навіть не зможемо контролювати джерело генерації коду. Коли AI почне самостійно проектувати та тренувати наступників, еволюція програмного забезпечення перетвориться на чорний ящик. Якщо у системі чорного ящика дозволити AI проводити самовдосконалення без людського аудиту, подальша безпека, моніторинг і узгодженість поведінки системи стануть надзвичайно складними.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено