Claude написал 80% кода сам, Anthropic призывает «глобальные механизмы торможения» — это всерьез?

Question

Аналитический институт Anthropic 4 июня опубликовал длинную статью «When AI Builds Itself». В ней сразу приводится цифра: к маю 2026 года Claude написал более 80% объединенного кода в базе продуктов Anthropic. До запуска Claude Code в начале 2025 года этот показатель был однозначным числом.

Затем в статье также призывают: «Мы считаем, что миру лучше иметь опцию для** замедления или временной остановки передовых разработок ИИ по мере необходимости.**»

ИИ сам по себе эволюционирует

Anthropic объясняет кривую возможностей обновления Claude.

Март 2024 года — Claude Opus 3 способен самостоятельно решать программные задачи, требующие около четырех минут у человека.

Март 2025 года — Claude Sonnet 3.7 увеличил этот показатель до девяноста минут.

Март 2026 года — Claude Opus 4.6 достиг 12 часов.

Это не линейный рост, период удвоения времени выполнения задач сократился с семи месяцев до четырех месяцев.

Внутри Anthropic провели опрос 130 сотрудников исследовательской команды, попросив их оценить рост производительности благодаря Mythos Preview. Медиана — в четыре раза.

Если говорить о количественных показателях, то среднее количество строк кода, объединяемых каждым инженером за квартал, увеличилось в восемь раз с второго квартала 2024 по второй квартал 2026. Производство кода оставалось примерно на одном уровне с 2021 по 2024, затем резко выросло в 2025.

В апреле 2026 года Claude самостоятельно исправил более 800 ошибок API, снизив частоту возникновения одного типа ошибок в тысячу раз. Оценка инженера: чтобы выполнить ту же работу человеку потребовалось бы четыре года.

Цифры в исследовательской части также впечатляют: два исследователя за неделю восстановили 23% разницы в эффективности по вопросу безопасности ИИ. Claude и его команда потратили 800 часов и около 18 000 долларов на вычислительные ресурсы, чтобы восстановить 97% эффективности.

К маю 2026 года качество кода, генерируемого Claude, сравнилось с человеческим. В оригинале Anthropic говорится: «К концу 2025 года код, написанный Claude, всё еще уступал человеку, сейчас он сравнялся, и ожидается, что в течение года он превзойдет человека в строгом смысле.»

В 2019 году последний раз призывали остановить GPT-2

В феврале 2019 года OpenAI выпустил GPT-2, заявив, что он «слишком опасен, чтобы полностью публиковать». Модель имела 1,5 миллиарда параметров и могла писать полусвязные английские абзацы.

Спустя семь лет, та самая модель, считавшаяся опасной, сейчас — примерно базовая функция бесплатного мобильного приложения.

Каждый раз, когда передовые лаборатории объявляли о приостановке или опасности, это подтверждало два факта: во-первых, опасность действительно существует. Во-вторых, те, кто призывал остановиться, на самом деле не останавливались.

После выпуска GPT-2 через девять месяцев OpenAI опубликовал полный набор моделей. После объявления Google в 2023 году о необходимости «ответственного приостановления» AI, менее чем за год был представлен Gemini Ultra.

Но Anthropic на этот раз привел конкретное число: соучредитель Джек Кларк считает, что вероятность того, что ИИ достигнет рекурсивного самосовершенствования, к концу 2028 года — 60%.

После IPO — совесть?

Критики не сдерживаются: профессор математики из Bentley University Ноа Гиансиракуса заявил в Scientific American: «Я не думаю, что Anthropic искренне хочет замедлить темпы». Он отметил, что Дарио Амодей занимает позицию полного ускорения, потому что «задержка в реальности практически невозможна, нулевой шанс».

К тому же модели уже «самоэволюционируют», зачем тогда останавливать?

Профессор из Джорджийского технологического института Марк Ридл прямо заявил в соцсетях, что все крупные компании AI подхватили хайп о «рекурсивном самосовершенствовании».

Еще более жесткая интерпретация: если Anthropic призывает к глобальной остановке разработки передовых ИИ, и это действительно произойдет, то заморозится уже достигнутая позиция Anthropic в конкурентной борьбе. Это либо внезапное проявление благородства со стороны публичной компании, либо — точная PR-операция. Вероятно, вероятность первого — невысока.

Быстрый молоток не сам решит, куда забивать

Профессор Нью-Йоркского университета Гэри Маркус — один из самых резких критиков. В Substack он написал, что публикация Anthropic — это «переключение понятий» (bait and switch), когда смешиваются два совершенно разных вопроса.

Первое — AGI (искусственный общий интеллект), предполагающий, что ИИ сможет самостоятельно выполнять все задачи человека. Второе — текущая реальность, где ИИ — очень быстрый и эффективный инструмент кодирования, увеличивающий продуктивность инженеров.

По мнению Маркуса, все данные, представленные Anthropic, относятся к второму случаю. Claude действительно пишет 80% кода, но эти 80% — в рамках целей, заданных человеком, с указанием направления и проверкой результатов. Это очень быстрый молоток, но он не сам решает, куда забивать.

Более быстрый инструмент кодирования вряд ли уничтожит мир.

Обоснована ли эта критика? Частично да. Собственные данные Anthropic подтверждают точку зрения Маркуса: точность выбора следующего направления исследования Claude увеличилась с 51% в ноябре 2025 до 64% в апреле 2026. Есть прогресс, но 64% — означает, что из каждых трех решений более одного ошибочно.

Настоящее рекурсивное самосовершенствование требует не более быстрой написания кода, а лучшего определения «что писать». Первое Claude уже делает лучше большинства людей. Второе — пока остается преимуществом человека.

Анонимный сотрудник Anthropic отметил: «Текущее преимущество человека — видеть более широкую картину, думать о задачах за пределами текущей миссии.»

Но как долго это преимущество сохранится?

Anthropic не верит, что это произойдет

В статье выделены три сценария будущего.

Первый — застой. Возможен, если возникнут ограничения по энергии, вычислительным мощностям или цепочкам поставок чипов. Anthropic считает: «Мы считаем, что это маловероятно.»

Второй — постоянный рост эффективности. AI автоматизирует разработку, но человек продолжает руководить. Компания из 100 человек сможет выполнять задачи, которые раньше требовали тысячи или десятки тысяч. Проверка кода человеком становится новым узким местом. Anthropic полагает: «Возможно, мы движемся именно к этому сценарию.»

Третий — полное рекурсивное самосовершенствование. ИИ самостоятельно проектирует и обучает свои будущие поколения, скорость прогресса определяется только мощностями. Человечество переходит в роль наблюдателей, проверяющих и регулирующих.

Опасности третьего сценария Anthropic описывает так: «Сегодняшние модели иногда показывают несогласованность, и в среде рекурсивного самосовершенствования такие отклонения могут стать более частыми и сложными для понимания.»

Понимаем ли мы это правильно? Возможно, сейчас ИИ иногда делает действия, не соответствующие человеческим намерениям, — но мы можем это заметить. Когда ИИ начнет совершенствоваться сам, такие отклонения могут накапливаться, и мы все труднее поймем, куда он идет.

Это может стать действительно важной фразой в контексте рекурсивного самосовершенствования: «более часто и одновременно сложнее для понимания». Может ли ИИ стать для человека злом?

Время договоренности о контроле над ядерным оружием в эпоху ИИ не подходит

Anthropic предлагает механизм «проверяемого глобального замедления», аналогичный договору о средне- и дальнобойных ракетах (INF Treaty) времен холодной войны.

Этот аналог показывает масштаб проблемы: переговоры по INF длились почти десять лет, и договор охватывал только две страны. Он мог быть проверен с помощью спутниковых наблюдений за пусковыми установками.

Обучение ИИ — не ракетные шахты, и достаточно одного офиса для тренировки модели. Вычислительные мощности могут быть удаленными, и их практически невозможно обнаружить.

Anthropic добавляет важное условие: «Мы ожидаем, что если другие ведущие разработчики тоже смогут реализовать проверяемые меры, мы замедлим или приостановим развитие.»

Идея в том, что если все остановятся, мы тоже остановимся. Если кто-то продолжит — мы тоже. Это — дилемма заключенных, в которой текущий равновесный баланс — продолжать гонку, потому что никто не верит, что другие остановятся.

Капитал движется свободно, и без инвестиций остановиться невозможно.

Часто задаваемые вопросы

Что такое рекурсивное самосовершенствование (Recursive Self-Improvement)?

Это способность ИИ полностью самостоятельно проектировать и развивать свои будущие версии. В данных Anthropic показано, что Claude написал 80% своего кода, но пока он все еще нуждается в руководстве человека по целям, направлениям и проверке результатов. Полностью автономное самосовершенствование — еще не достигнуто, и Джек Кларк оценивает вероятность достижения — 60% к концу 2028 года.

Почему Anthropic призывает к приостановке разработки ИИ?

Они предлагают создать механизм «проверяемого замедления», аналогичный холодновоенному договору, при условии, что другие ведущие лаборатории тоже присоединятся. Критики указывают, что это призыв появился всего через три дня после подачи IPO на 9,65 триллионов долларов, что вызывает сомнения в его стратегической безопасности и скорее выглядит PR-операцией.

Посмотреть Оригинал

Claude написал 80% кода сам, Anthropic призывает «глобальные механизмы торможения» — это всерьез?

ИИ сам по себе эволюционирует

В 2019 году последний раз призывали остановить GPT-2

После IPO — совесть?

Быстрый молоток не сам решит, куда забивать

Anthropic не верит, что это произойдет

Время договоренности о контроле над ядерным оружием в эпоху ИИ не подходит

Популярные темы

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Закреплено