Члени команди Anthropic все частіше передають системам ШІ більшу частину розробки нових моделей. У компанії побачили в цьому ознаки наближення до рекурсивного самовдосконалення.

Згідно внутрішніх даних, понад 80% коду актуальних продуктів фірми написав Claude. При цьому у другому кварталі обсяг коду на одного інженера зріс у вісім разів порівняно з 2024 роком.

Джерело: Anthropic Institute.Голова Anthropic Institute Марина Фаваро та співзасновник компанії Джек Кларк написали, що при достатньому обсязі обчислень тренд може призвести до системи, здатної «повністю автономно проектувати та розробляти свого наступника».

«Ми ще не досягли точки невідворотності, і рекурсивне самовдосконалення не є неминучим. Але воно може настати раніше, ніж до цього будуть готові більшість інститутів», — підкреслили експерти.

Бенчмарки та метрики

У квітні Claude виконав понад 800 виправлень — за оцінкою курируючого інженера, у людини на це пішло б чотири роки.

На відкритих задачах частка успішних сесій Claude зросла до 76% у травні 2026 року — плюс 50 відсоткових пунктів за шість місяців.

Джерело: Anthropic Institute.У Anthropic заявили, що тривалість задач, які ШІ здатен надійно виконувати самостійно, подвоюється приблизно кожні чотири місяці (проти попередніх семи).

У задачі на прискорення навчання невеликої моделі Claude Opus 4 у травні 2025 року в середньому давав приріст швидкості приблизно у три рази, а Mythos Preview у квітні 2026 — приблизно у 52 рази.

Джерело: Anthropic Institute.У ході внутрішніх тестів модель Mythos Preview продемонструвала здатність розв’язувати дослідницькі задачі у галузі безпеки ШІ. За 800 годин роботи група агентів закрила 97% проблемного розриву в експерименті, тоді як двоє дослідників-людей за тиждень впоралися лише з 23% обсягу.

Нові вузькі місця

Незважаючи на успіхи у написанні коду, за людьми зберігається перевага у «дослідницькому судженні» та визначенні стратегічних цілей.

В Anthropic вважають, що найближчим часом роль розробників зміститься від написання рядків коду до глибокого огляду результатів роботи нейромережі. Саме людська перевірка може стати головним гальмом у швидкості розробки нових моделей.

У компанії також допустили, що світу було б корисно мати можливість уповільнити або тимчасово призупинити розробку передових систем ШІ, щоб громадські інститути та дослідження у галузі вирівнювання встигали за прогресом.

Паралельно представники стартапу попередили: одностороннє уповільнення може зіграти проти тих, хто гальмує — менш обережні гравці зможуть скоротити відставання. Без глобального механізму координації рішення щодо безпеки доведеться приймати під конкурентним і геополітичним тиском.

Нагадаємо, у травні Anthropic опублікувала перший звіт за Project Glasswing — програмою пошуку вразливостей за допомогою моделі Claude Mythos.

У тому ж місяці компанія випустила Claude Opus 4.8 і окремо представила для Claude Code функцію динамічних робочих процесів.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
ShareYourUSStocksWinNvidia
3.51M Популярність
#
PredictNBAChampionWin20000U
2.18M Популярність
#
IsraelStrikesIranBTCPlunges
54.89K Популярність
#
BitcoinETFSees7272BTCOutflow
657.53M Популярність
#
SpaceXRoadshowHighlightsAsteroidMining
1.39M Популярність

Закріплено

карта сайту

Anthropic попередила про ризики самовдосконалення ШІ - ForkLog: криптовалюти, ШІ, сингулярність, майбутнє

Бенчмарки та метрики

Нові вузькі місця

Популярні теми

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Закріплено