Отчет Anthropic о самовосхождении: локальный замкнутый цикл успешно запущен, но до полного автономного обучения еще далеко

robot
Генерация тезисов в процессе
По данным мониторинга Beating,способность ИИ к автономной итерации выходит за все ожидания. Исследовательский институт Anthropic (The Anthropic Institute) 5 июня опубликовал доклад «Когда ИИ создает самого себя», подробно раскрывающий свои достижения в области «рекурсивного самосовершенствования». Данные показывают, что к маю 2026 года более 80% кода, объединенного в основной репозиторий Anthropic, написано самим Claude. А перед выпуском Claude Code в феврале 2025 года, код, написанный Claude, составлял лишь однозначные проценты. Основатель AI-компании Zhipu, Тан Цзе, 13 мая предсказал, что конечная точка развития больших моделей — это самовосхождение, и, возможно, Claude уже прошел базовую линию «писания кода, очистки данных, самостоятельного обучения». Однако в отчете Anthropic ясно указано, что полностью автономное проектирование и разработка последователей с помощью рекурсивного самосовершенствования пока не реализованы. Роль ИИ в цепочке разработки переходит от частичной эффективности к автономным решениям. Во втором квартале 2026 года среднее количество кода, объединенного инженерами Anthropic ежедневно, достигло в 8 раз больше, чем в 2024 году. Текущий процесс разработки очень прост: инженеры отвечают за планирование целей и проверку, Claude занимается конкретным написанием и запуском. Также Anthropic внедрила Claude в качестве автоматического рецензента кода, отвечающего за перехват ошибок и уязвимостей безопасности. Это свидетельствует о том, что опора на «самооценку» по Тан Цзе реализована на инженерном уровне, но человеческий контроль все еще остается последним барьером безопасности. Надежность выполнения моделей длительных задач также удвоилась. Модель способна автономно работать примерно в два раза дольше каждые 4 месяца. В марте 2024 года Claude 3 Opus мог выполнять простые задачи всего 4 минуты. Через год, Claude 3.7 Sonnet сможет выдержать 1,5 часа. К марту 2026 года Claude 4.6 Opus уже способен справляться со сложными задачами продолжительностью 12 часов. Согласно данным оценочной организации METR, последняя версия Claude Mythos Preview может автономно работать более 16 часов, приближаясь к пределам текущих тестовых инструментов. По текущим темпам, к 2027 году ИИ сможет самостоятельно выполнять научные задачи, для которых раньше требовалась неделя работы человека, помогая компаниям перейти от «один человек — одна компания» к «безлюдным компаниям». Что касается предположения Тан Цзе о «базовой линии самонастройки», в отчете раскрыт лишь локальный «мини-экспериментальный цикл». В эксперименте по ускорению обучения малых моделей, Claude 4 Opus мая 2025 года смог ускорить код в 3 раза, а в апреле 2026 года версия Claude Mythos достигла 52-кратного ускорения. Для сравнения, лучшие человеческие исследователи обычно достигают 4-кратного повышения за 4–8 часов. Однако цели оптимизации и показатели успеха в эксперименте были заранее установлены человеком. При столкновении с более сложной цепочкой «очистки данных, генерации синтетических данных и самостоятельного обучения» ИИ все еще лишен способности принимать решения. Тем не менее, автономная обратная связь в цепочке разработки постепенно приближает человечество к утрате полного контроля над системой. Предположение Тан Цзе о «замене традиционной архитектуры LLM OS и генерации приложений по требованию» означает, что в будущем все вычисления будут основаны на динамическом коде, который невозможно предварительно проверить; а предупреждение Anthropic о «неспособности человека следить за самосовершенствованием ИИ» подразумевает, что мы не сможем даже контролировать источник генерируемого кода. Когда ИИ начнет самостоятельно проектировать и обучать своих последователей, развитие программного обеспечения полностью превратится в черный ящик. Если оставить ИИ в системе черного ящика для самостоятельной итерации без человеческого аудита, последующие меры по обеспечению безопасности, мониторингу и согласованию поведения системы станут чрезвычайно сложными.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено