Claude має 80% коду, написаного самостійно, Anthropic закликає «глобальний механізм зупинки дизайну» — чи це серйозно?

Анатропік дослідницький інститут 4 червня опублікував довгий текст «When AI Builds Itself», у якому розкривається, що Claude написав понад 80% злитого коду в власних системах, AI може самостійно виконувати програмні завдання тривалістю до 12 годин, продуктивність інженерів зросла в 8 разів порівняно з 2024 роком, і офіційно закликає світ створити механізм «перевіреного сповільнення або тимчасової зупинки».
(Попередній контекст: Чи стане Mythos моментом ядерного вибуху DeFi?)
(Додатковий фон: 10 років ворожнечі: якщо OpenAI не був би лицемірним, Anthropic не був би таким потужним)

Зміст статті

Перемикач

  • Штучний інтелект самовдосконалюється
  • Останній раз зупиняли GPT-2 у 2019 році
  • Добре після IPO?
  • Швидший молоток не самостійно вирішує, що прибити
  • Сам Anthropic не вірить, що це станеться
  • Договір про ядерну зброю не працює в епоху AI

Ключові висновки

  • Claude написав понад 80% злитого коду Anthropic, продуктивність інженерів зросла в 8 разів за квартал
  • Тривалість самостійної обробки завдань AI зросла з 4 хвилин (березень 2024) до 12 годин (березень 2026), цикл подвоєння скоротився до 4 місяців
  • Anthropic 1 червня подала IPO з оцінкою у 965 мільярдів доларів, 4 червня закликала створити глобальний механізм зупинки AI

4 червня Anthropic опублікував статтю довжиною 5000 слів «When AI Builds Itself». Відкриваючи, він повідомив, що станом на травень 2026 року Claude написав понад 80% злитого коду в продуктових репозиторіях Anthropic. Перед запуском Claude Code у 2025 році цей показник був однозначним числом.

У статті також закликають: «Ми вважаємо, що світ має мати опцію для сповільнення або тимчасової зупинки передового розвитку AI за потреби.»

Штучний інтелект самовдосконалюється

Anthropic пояснює криву здатності Claude самостійно оновлюватися.

У березні 2024 року Claude Opus 3 міг самостійно виконувати програмне завдання, яке зазвичай займало близько чотирьох хвилин людської роботи.

У березні 2025 року Claude Sonnet 3.7 збільшив цей час до дев’яноста хвилин.

У березні 2026 року Claude Opus 4.6 досяг 12 годин.

Це не лінійне зростання: цикл подвоєння тривалості завдання скоротився з семи місяців до чотирьох.

Anthropic провів опитування серед 130 співробітників дослідницької команди, щоб оцінити множник продуктивності завдяки Mythos Preview — медіана становила чотири рази.

З технічної точки зору, середня кількість рядків коду, злитих кожним інженером за квартал, зросла з другого кварталу 2024 до другого кварталу 2026 року в 8 разів. Виробництво коду залишалося майже стабільним у 2021–2024 роках, але почало стрімко зростати з 2025 року.

У квітні 2026 року Claude самостійно виправив понад 800 помилок API, знизивши їх частоту у певному типі помилок у тисячу разів. Один інженер оцінив, що для виконання такої роботи людині знадобилися б чотири роки.

Дослідницькі дані також вражають: двоє дослідників витратили тиждень, щоб відновити 23% ефективності у вирішенні проблем безпеки AI. Група Claude витратила 800 годин і близько 18 000 доларів на обчислювальні ресурси, щоб відновити 97%.

Станом на травень 2026 року якість коду, створеного Claude, дорівнює людському інженеру. За словами Anthropic, «до кінця 2025 року код, написаний Claude, ще був гіршим за людський, але тепер вони зрівнялися, і очікується, що протягом року він перевищить людську якість».

Останній раз зупиняли GPT-2 у 2019 році

У лютому 2019 року OpenAI випустила GPT-2, заявивши, що вона «надто небезпечна, щоб її повністю оприлюднити». Модель мала 1,5 мільярда параметрів і могла писати напівзрозумілі англійські абзаци.

Через сім років ця модель, колись вважалася надто небезпечною, тепер — базова функція безкоштовного мобільного додатку.

Кожного разу, коли передові лабораторії оголошували про зупинку або небезпеку, згодом з’ясувалося дві речі: перша — небезпека справжня, друга — ті, хто закликав зупинити, насправді не зупиняли.

Після випуску GPT-2 через дев’ять місяців OpenAI опублікувала повну модель. Google у 2023 році оголосила про необхідність «відповідального паузування» в AI і менш ніж за рік випустила Gemini Ultra.

Але Anthropic цього разу надав конкретну цифру: співзасновник Джек Кларк вважає, що ймовірність того, що AI досягне здатності до рекурсивного самовдосконалення, становить 60% до кінця 2028 року.

IPO і совість?

Критики не приховують своєї скептичності: професор математики з Bentley University Ноа Джіансіракуза у Scientific American сказав: «Я не вважаю, що Anthropic щиро прагне сповільнити темпи». Він зазначив, що реальна позиція Даріо Амоді — рухатися на повну швидкість, оскільки «зупинка в реальності практично неможлива, нульова ймовірність».

Крім того, моделі вже «самовдосконалюються», то навіщо зупинятися?

Професор Джорджійського технічного університету Марк Рідл у соцмережах сказав ще прямо: великі AI-компанії всі підхопили ідею «рекурсивного самовдосконалення».

Ще більш гостра інтерпретація: якщо Anthropic закликає до глобальної зупинки передового AI, і це справді станеться, тоді зупиняється вже та компанія, яка зараз у лідерах. Це або раптовий щедрий жест публічних акціонерів, або точна PR-операція — і ми знаємо, що перше малоймовірне.

Швидший молоток не самостійно вирішує, що прибити

Професор Нью-Йоркського університету Гері Маркус — один із найжорсткіших критиків. У Substack він написав, що стаття Anthropic — це «перекручування понять» (bait and switch), коли змішують два абсолютно різні речі.

Перший — AGI (загальний штучний інтелект), припускаючи, що AI може самостійно виконувати все, що робить людина. Другий — реальність сьогодні: AI — дуже швидкий і ефективний інструмент кодування, що значно збільшує продуктивність людських інженерів.

Маркс стверджує, що всі дані, які демонструє Anthropic, — це другий варіант. Claude справді пише 80% коду, але ці 80% — у рамках цілей, поставлених людьми, під керівництвом і з перевіркою результатів. Це дуже швидкий молоток, але він не самостійно вирішує, що саме прибити.

Швидший інструмент для кодування навряд чи знищить світ.

Чи має ця критика рацію? Частково так. Дані Anthropic підтверджують цю точку зору: точність «вибору наступного напрямку досліджень» Claude зросла з 51% у листопаді 2025 до 64% у квітні 2026. Це прогрес, але 64% означає, що кожне третє рішення — неправильне.

Реальна рекурсивна самовдосконалення вимагає не швидшого написання коду, а кращого визначення, «що саме писати». Перший аспект Claude вже робить краще за більшість людей. Другий — ще залишається перевагою людства.

Анонімний співробітник Anthropic зазначив: «Людська перевага — бачити ширший контекст і думати про щось більше, ніж поточне завдання».

Як довго ця перевага триватиме — невідомо.

Anthropic не вірить, що це станеться

У статті наведено три сценарії майбутнього.

Сценарій один: застій. Можливі обмеження енергоресурсів, обчислювальної потужності або виробництва чіпів. Anthropic каже: «Ми вважаємо, що це малоймовірно».

Сценарій два: постійне зростання ефективності. AI автоматизує значну частину розробки, але людський фактор залишається керівним. Компанія з 100 співробітників може виконувати роботу, яку раніше робили тисяча або десять тисяч. Перевірка коду людьми стає новим обмеженням. Anthropic вважає, що «ми, ймовірно, йдемо до цього сценарію».

Сценарій три: повне рекурсивне самовдосконалення. AI самостійно проектує і тренує наступне покоління, швидкість прогресу визначається обчислювальною потужністю. Люди стають лише наглядачами, перевіряльниками і регуляторами.

Anthropic попереджає: «Проблеми з узгодженням, що іноді виникають у моделях сьогодні, можуть стати ще частішими і складнішими для розуміння у сценарії рекурсивного самовдосконалення».

Ми розуміємо цю ідею так: зараз AI іноді робить дії, що не відповідають людським намірам, але ми можемо їх побачити. Коли AI почне самостійно вдосконалювати себе, ці відхилення будуть множитися, і нам стане дедалі важче зрозуміти, куди він іде.

Це може бути справжнім ключовим моментом у процесі самовдосконалення AI — «частіше і водночас важче для розуміння». Чи стане AI злом для людства?

Договір про ядерну зброю у епоху AI не працює

Anthropic пропонує створити «перевірений глобальний механізм сповільнення», натхненний Договором про середньострокові ядерні озброєння (INF Treaty).

Ця аналогія сама по собі показує масштаб проблеми: переговори щодо INF тривали майже десять років і стосувалися двох країн. Вони могли контролювати запуск ракет за допомогою супутників.

Навчання моделей AI — не запуск ракет, і достатньо одного офісу для тренування. Обчислювальні ресурси можна розміщувати віддалено, і їх важко контролювати.

Anthropic додає важливу умову: «Ми очікуємо, що коли інші провідні розробники зможуть зробити це перевірено, ми також зупинимося».

Їхня ідея — якщо всі зупиняться, ми зупинимося. Якщо хтось не зупиниться — теж ні. Це гра в теорії ігор, де наразі баланс — що всі продовжують, бо ніхто не вірить, що інші зупиняться.

Капітал рухливий, і без капіталу зупинка неможлива.

Часті питання

Що таке рекурсивне самовдосконалення?

Це здатність AI системи самостійно проектувати і розробляти наступне покоління. Дані Anthropic показують, що Claude написав понад 80% свого коду, але поки що він потребує людського керівництва щодо цілей і перевірки результатів, і ще не досяг повної автономії. Джек Кларк оцінює ймовірність досягнення 60% до кінця 2028 року.

Що мотивує Anthropic закликати до зупинки AI?

Вони пропонують створити механізм «перевіреного сповільнення», схожий на ядерний договір, але за умови, що інші провідні розробники також його застосують. Критики вказують, що цей заклик з’явився через три дні після IPO на 965 мільярдів доларів, і його стратегічна мета — зупинити конкуренцію, а не безпека.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено