Кто лучше всего использует Claude Code? Ответ может быть не программистом

Question

> Оригинальный заголовок: Агентное кодирование и постоянные возвращения к экспертизе
> Автор оригинала: Anthropoic
> Перевод: Peggy
>

Редакторский комментарий: Этот доклад основан на примерно 400 000 сессиях Claude Code, обсуждая, как инструменты ИИ для программирования меняют отношения между человеком и кодом.

Самое важное открытие: в агентном программировании человек в основном решает «что делать», а Claude — «как делать». Пользователь берет на себя большую часть планирования, Claude — большую часть выполнения. То есть ИИ берет на себя такие этапы реализации, как написание кода, изменение файлов, выполнение команд, отладка, но цели и оценка результатов по-прежнему зависят от человека.

Более того, эффективность использования Claude Code зависит не только от того, является ли пользователь программистом. В докладе показано, что в задачах генерации кода успехи пользователей из профессий, не связанных с техникой — юриспруденцией, финансами, управлением, научными исследованиями — уже близки к уровню инженеров-программистов. Настоящее влияние на результат оказывает понимание пользователем решаемой задачи.

Это означает, что ИИ снижает порог входа для реализации, но не для оценки. В будущем, люди, разбирающиеся в бизнесе, сценариях, умеющие четко формулировать требования и оценивать результаты, могут оказаться более эффективными в использовании ИИ, чем просто умеющие писать код. ИИ не заменит автоматом предметные знания, наоборот — усилит их ценность.

Ниже — оригинальный текст:

Ключевые открытия

На основе существующих исследований мы предложили рамочную модель для изучения взаимодействия с интерактивными агентами программирования. Эта модель основана на анализе конфиденциальности примерно 400 000 сессий Claude Code, проведенных с октября 2025 по апрель 2026 года, и оценивает состав задач, способы сотрудничества человека и ИИ, а также уровень успеха.

В типичной сессии человек отвечает за большинство планировочных решений — то есть решает «что делать», а Claude — за большинство исполнительных — то есть «как делать». Чем больше профессиональных знаний у пользователя в конкретной области, тем больше работы вызывает команда Claude. В задачах кодирования средний уровень успеха у различных профессиональных групп — то есть выполнение задуманного, подтвержденное тестами, отправкой кода и т. п. — почти сравним с инженерами-программистами.

Чем выше профессиональный уровень пользователя, тем больше шансов, что сессия завершится успешно. Однако разница между средним и экспертом невелика. За семь месяцев мы наблюдали почти вдвое снижение доли сессий, связанных с отладкой, и переход к более «сквозным» способам использования: развертывание и запуск кода, анализ данных, подготовка текстовых документов.

За эти семь месяцев ценность типичных задач выросла почти во всех сферах работы. Мы оценили это, сравнивая с объявлениями о вакансиях фрилансеров, и получили средний рост примерно на 25%.

Введение

Агентное программирование быстро развивается. С конца 2025 года доля проектов на GitHub, связанных с кодирующими агентами, удвоилась, а среднее время использования Claude Code — около 20 часов в неделю. Может ли человек без формального опыта программирования успешно управлять сложными техническими задачами с помощью таких инструментов? Как быстро эти инструменты распространяются и улучшают свои возможности, и как это повлияет на более широкие сферы знаний? Пока мы не можем дать полный ответ, но по данным использования Claude Code уже видны некоторые ранние сигналы.

Этот доклад основан на анализе конфиденциальных данных примерно 235 000 пользователей и около 400 000 интерактивных сессий за период с октября 2025 по апрель 2026 года, что дает реальные свидетельства о способах использования Claude Code. Он продолжает наши исследования автономных показателей сессий Claude Code и того, как эти инструменты меняют внутреннюю работу Anthropoc. В статье предложена рамочная модель для описания использования интерактивных помощников ИИ: что делают люди, кто это делает, и насколько успешно. Мы рассматриваем использование Claude Code через командную строку, Claude.ai или настольное приложение. Отслеживая, как меняется способ использования агентного программирования с ростом возможностей модели, мы лучше понимаем влияние этих инструментов на профессионалов-программистов и рынок труда знаний.

То, что происходит с Claude Code, возможно, предвосхищает будущее сферы знаний: агенты постепенно интегрируются в некодирующую работу. Мы видим, что Claude занимается все более сложными и ценными задачами. В то же время, в агентном программировании сохраняется четкое разделение труда: человек решает, что строить, а агент — как.

Также есть данные, что истинное усиление эффективности инструмента достигается за счет предметных знаний, а не навыков программирования. Особенно успешны в этом эксперты, которые легче восстанавливаются после ошибок и недоразумений. Однако разница между экспертами и средним уровнем невелика. Это говорит о том, что при достаточной компетентности в области человек может использовать такие инструменты почти как глубоко профессионал.

Эти открытия позволяют сделать предварительные выводы о возможных изменениях на рынке труда. В наших данных успех зависит не от наличия программных навыков, а от понимания решаемой задачи. Если эти модели подтвердятся в целом, это означает, что агентное программирование, хотя и поглощает часть задач, ориентированных на реализацию, одновременно поощряет тех, кто действительно понимает, что решает. Создание программных агентов не заменяет предметные знания. Чем больше понимания у работника о своей задаче, тем лучше он сможет управлять агентом и получать качественный результат.

Распределение труда

Что делают люди с Claude Code

Чтобы понять, как используют Claude Code, мы классифицируем каждую сессию по девяти моделям работы, которые наиболее точно отражают цель этой сессии. Четыре из них связаны с написанием или обслуживанием кода: создание новых решений, исправление ошибок, тестирование, организация работы других агентов или автоматизированных процессов. Еще одна категория — управление программным обеспечением: развертывание, настройка, запуск и мониторинг систем. Есть две категории, связанные с пониманием «что делать»: понимание работы существующей системы и планирование изменений перед началом работы. И две последние — не связанные с кодом или только вспомогательные: анализ данных и коммуникация через презентации и текстовые документы.

Около 56% сессий — это создание кода (25%), исправление ошибок (26%) или тестирование и организация работы кода (5%). Управление программным обеспечением — 17%, планирование или исследование — 14%, анализ данных и подготовка текстов — 13% (см. рис. 1).

> Рис. 1: Девять моделей работы. Каждая интерактивная сессия классифицируется по наиболее подходящей модели.

Сначала модель читает историю сессии и классифицирует ее; затем, с помощью нашего инструмента анализа конфиденциальности, мы сопоставляем результаты классификации с телеметрическими данными каждой сессии, включая добавление или удаление строк кода. Эти два источника показывают очень высокое совпадение. Например, в сессиях, отмеченных как создание или изменение кода, более 90% случаев также показывают изменения в телеметрике. Подробнее — в приложении.

Кто принимает решения

Насколько автономен Claude Code? Оценки показывают, что его потенциал очень высок и продолжает расти. Например, в тестах METR, оценивающих временные рамки, современные модели уже могут самостоятельно выполнять задачи, ранее требовавшие часов работы человека, и самостоятельно преодолевать препятствия. Но как это выглядит на практике? В этой части мы рассматриваем, сколько руководства дают человеку и Claude в реальных сессиях.

Мы изучаем этот вопрос с двух сторон. Первая — насколько человек доверяет решениям Claude; вторая — сколько действий он поручает агенту. Для этого мы создали классификатор, который на основе содержания сессии определяет, какие решения принимает человек, а какие — агент. Он делит решения на планировочные (что делать, как делать, что считать завершением) и исполнительные (какие файлы менять, что писать, на каком языке, какие команды запускать). Затем он определяет, кто за каждое решение отвечает — человек или агент — и выводит два процента: долю решений, которые принимает человек в плане и в исполнении.

В среднем человек принимает около 70% планировочных решений, но только 20% исполнительных (см. рис. 2). На практике агентное программирование формирует четкое разделение труда: человек решает, что строить, агент — как.

Чтобы понять, насколько делегированы действия в сессии, мы не смотрим на содержание, а анализируем структуру. Сессия Claude — это серия обменов между человеком и агентом: пользователь дает подсказки, агент выполняет действия; затем пользователь снова дает подсказки, и так далее. В типичной сессии таких раундов около четырех. За период с октября по апрель в наших данных, каждый раз, когда пользователь дает подсказку, Claude выполняет в среднем около 10 действий, иногда более 100. В каждом раунде агент читает файлы, редактирует код, запускает команды, и в среднем пишет около 2400 слов.

Объем работы, который Claude выполняет между двумя проверками пользователя, во многом зависит от того, кто принимает решения. Когда пользователь контролирует выполнение более 80% решений, Claude делает примерно 8 действий за раунд. Когда же агент берет на себя более 80% планирования, он выполняет около 16 действий.

> Рис. 2: Доля планировочных и исполнительных решений, принадлежащих Claude. Показано распределение решений между человеком и агентом в типичных сессиях. В среднем человек принимает около 70% планировочных решений, а Claude — около 80% исполнительных.

Профессиональный уровень

На основе каждой сессии Claude оценивает уровень профессионализма пользователя по пятибалльной шкале — от новичка до эксперта. Классификатор уровня учитывает три сигнала: точность команд пользователя, что он требует от Claude проверить, и кто чаще исправляет другого — пользователь или агент. Важно отметить, что этот уровень не совпадает с должностью или общими навыками; он конкретен для задачи. Например, опытный инженер, впервые спрашивающий о Rust, может быть новичком в этой области, а бухгалтер, не знающий Python, сможет стать экспертом по конкретному скрипту, если точно скажет, какие правила проверки он должен выполнять.

В таблице приведены определения уровней профессионализма и примеры запросов из открытого датасета SWE-chat. Диалог, классифицированный как «новичок», содержит общие инструкции без предметных знаний; диалог «экспертный» — демонстрирует глубокое понимание кода и технической среды.

> Табл. 1: Классификация профессиональных уровней. Примеры из реальных сессий, взятые из открытого датасета SWE-chat, с нашими аннотациями. Многие примеры — из публичных данных о взаимодействии с агентами.

Мы связали уровень профессионализма с количеством действий и объемом текста, вызываемых каждым запросом. В типичных сессиях новичков каждый запрос вызывает около 5 действий и около 600 слов вывода; у экспертов — более чем вдвое больше действий, около 12, и около 3200 слов, что в пять раз больше (см. рис. 3). Разрыв между уровнями наблюдается во всех типах задач и диапазонах ценности.

Эти показатели дополняют наши предыдущие исследования автономности Claude Code. Тогда мы отслеживали продолжительность работы агента и частоту автоматического одобрения его действий. В отличие от этого, наши метрики определения решений фиксируют, кто принимает важные решения в сессии, а количество действий и текста — насколько автономен агент при выполнении команд человека.

> Рис. 3: Чем более профессионален пользователь, тем больше работы выполняет Claude за один запрос. Чем выше уровень, тем больше действий (левая диаграмма) и текста (правая). Коробки — квартиль, медиана — линия внутри. Усеченные линии — 5-й и 95-й перцентили. Белые точки — геометрические средние. Оба тренда статистически значимы (p < 0.001). После учета режима работы, ценности задачи, месяца, профессии и серии модели, а также кластеризации по пользователю, тренд сохраняется: каждый уровень профессионализма увеличивает число действий на 9%, объем текста — на 13%.

Кто использует Claude Code и зачем

Пользователи

Чтобы понять, кто занимается этими задачами, мы по записям сессий определяем профессию каждого пользователя и сопоставляем ее с 23 основными категориями по классификации Бюро статистики труда США (SOC). Классификатор использует только сигналы: контекст, названия и структура файлов, цитируемые материалы (юридические документы, клинические данные, финансовые отчеты, учебные материалы и т. п.), а также лексика пользователя. В явном виде запрещено считать «написание кода» признаком программной деятельности. Только при наличии четких признаков, что пользователь занимается программированием или обработкой данных, сессия попадает в категорию «компьютеры и математика». Например, если юрист создает скрипт для автоматической проверки договоров, даже если основная деятельность — юридическая, сессия классифицируется как связанная с юриспруденцией. Если признаков профессии нет — сессия не классифицируется.

В примерно 70% случаев нам удается определить профессию. В этих случаях «компьютеры и математика» — крупнейшая группа, что неудивительно, поскольку она включает большинство программных задач. Следом идут бизнес и финансы, искусство и медиа, управление, а также науки о жизни, физике и обществе. Самые быстро растущие среди непрофессиональных программных групп — управление, продажи и юриспруденция.

Работа

За период с октября 2025 по апрель 2026 года структура задач, выполняемых с помощью Claude Code, заметно изменилась. Самое заметное — доля сессий по исправлению ошибок снизилась с 33% до 19% (см. рис. 4). Вместо этого увеличилась доля задач, связанных с управлением программным обеспечением: с 14% до 21%. В два раза выросла доля задач по написанию и анализу данных — с 10% до 20%.

Ценность задач также выросла. Мы оценили ее, сравнивая с рыночными ценами на аналогичные работы у фрилансеров, и откалибровали по реальным объявлениям. В среднем, ценность одной сессии за этот период выросла примерно на 27%. Рост наблюдается во всех типах задач: создание, управление и исправление — примерно на 43%, 34% и 32% соответственно. Эти оценки — очень приблизительные, и служат скорее для сравнения трендов, чем для точной оценки стоимости в долларах. Подробнее о методике оценки — в приложении.

> Рис. 4: Изменения в структуре и ценности задач Claude Code с октября 2025 по апрель 2026. За семь месяцев доля сессий по исправлению ошибок снизилась с 33% до 19%, а доля задач по управлению программным обеспечением, анализу данных и подготовке документов выросла.

Успех зависит от того, что привносит пользователь

Оценка ценности задач — один из способов понять, как Claude Code помогает людям работать. Другой — анализировать, сколько сессий считается успешными и какие признаки связаны с успехом. В целом, мы видим четкую закономерность: чем выше профессиональный уровень пользователя, тем выше вероятность успеха сессии. Большая часть прироста приходится на переход от новичка к среднему уровню, а разница между средним и экспертом — меньшая.

Перед анализом признаков успешных сессий важно точно определить, что считается успехом. Мы не можем наблюдать реальные результаты в мире, и не можем напрямую спрашивать, завершил ли пользователь задачу с помощью Claude. Поэтому используем два взаимодополняющих метода оценки на основе записей сессий. Первый — «определение успеха» — после полного анализа сессии классификатор решает, достиг ли пользователь своей цели, с вариантами: успешно, частично успешно, неудача, без ясной цели. Затем два вспомогательных классификатора оценивают степень доказательств: один ищет подтверждения успеха (например, коммиты, тесты, одобрения), другой — признаков ошибок или неудач. Успех считается подтвержденным, если оба условия выполнены: сессия признана успешной и есть хотя бы один сильный признак успеха. Анализируем только такие сессии, исключая около 7.7% сессий, где цель не ясна.

Профессиональный уровень и отдача

Какие сессии наиболее вероятно завершатся успешно? Влияние профессионального уровня подтверждается данными.

Некоторые могут сомневаться, что уровень профессионализма — это главный фактор. Возможно, эксперты просто выбирают другие задачи или отличаются по другим признакам. В этой части мы сравниваем одинаковые типы задач, одинаковую ценность, месяц, тему и профессию, чтобы понять, как уровень влияет на результат.

> Табл. 2: Определение успеха и неудачи по классификатору. Примеры из реального датасета SWE-chat, с нашими аннотациями. Многие — из публичных данных о взаимодействии с агентами.

Во всех показателях, связанных с успехом, более высокий профессиональный уровень повышает шансы на успех. Диалог, классифицированный как «новичок», достигает успеха по строгому критерию «подтвержденный успех» в 15% случаев, и частично — в 77%. Диалоги «средний» и «экспертный» — с подтвержденным успехом в 28–33%, и частичным — в 91–92% (см. рис. 5).

Большая часть прироста — при переходе с новичка на средний уровень; между средним и экспертом прирост замедляется. Детали регрессии — в приложении.

> Рис. 5: Связь профессионального уровня и исхода сессии. График показывает, как меняется результат в зависимости от уровня — от новичка до эксперта. Левая — все сессии, средняя и правая — только те, где есть признаки проблем (больше 3). Каждая точка — скорректированное отношение. Мы сравниваем только сессии с одинаковым режимом работы, ценностью задачи, месяцем, темой и профессией, чтобы оценить влияние уровня. Детали регрессии — в приложении. Ошибки — в пределах доверительных интервалов, большинство из-за малого объема данных и не видны на графике. Исключены сессии без ясной цели.

Даже в сложных случаях, когда сессия сталкивается с проблемами, видна та же градация. Когда есть подтвержденные признаки неудачи, вероятность, что сессия «завершилась проблемой», возрастает. Это может включать ошибки, неудачные тесты, повторные попытки или недовольство пользователя. В таких случаях, после учета всех переменных, подтвержденный успех повышается с 4% у новичков до 15% у экспертов (см. рис. 5). При более мягких критериях, доля частичных успехов у новичков — около 60%, у опытных — 80–81%.

Также мы отслеживали обратную зависимость: уровень профессионализма и виды неудач. Важно, что в этом анализе сессии, признанные неуспешными, — это те, где вообще не достигнуто даже частичное успеха. Если сессия с проблемой полностью не завершилась и не было написано ни одной строки кода, мы называем ее «отказ». У новичков таких случаев — 19%, у других — 5–7%. То есть, менее опытные пользователи при трудностях чаще сдаются. Навык — это не только знание, но и умение вернуть агент в нужное русло.

Профессия важнее, чем уровень

Пользователи из программных профессий показывают примерно 30% подтвержденных успехов, остальные — около 26%. В сессиях с хотя бы одной добавленной или измененной строкой кода эти показатели — 34% и 29% (см. рис. 6). При более мягких критериях разница сокращается. В таких сессиях, по данным, около 89–88% достигают хотя бы частичного успеха. Разница в пять процентов — незначительна и не меняется за семь месяцев, несмотря на рост успехов у обеих групп. В десяти крупнейших профессиональных групп, каждая из которых включает инженеров, разница в успехе с инженерами-программистами — менее семи процентов. Управленцы показывают чуть более высокий уровень подтвержденных успехов, что может отражать перенос управленческих навыков на управление агентами. Но это также может быть связано с нашим методом измерения: подтверждение успеха во многом зависит от явного подтверждения пользователя, а управленцы привыкли выражать удовлетворение, когда получают желаемый результат.

> Рис. 6: Уровень подтвержденных успехов и неудач по профессиям. В сессиях с хотя бы одной строкой кода, по строгой оценке успеха, разница между группами — менее семи процентов. Каждая точка — скорректированное отношение, доверительные интервалы — 95%. Включены только сессии с ясной целью, исключены без цели.

Перспективы

Результаты этого доклада рисуют картину, которая формируется: агентное программирование усиливает некоторые знания и навыки, одновременно заменяя другие. В задачах по созданию кода успехи всех профессий почти не отличаются от программных специалистов. Кажется, что использование кодирующих агентов делает менее важным наличие программного опыта для успешного выполнения задач.

При этом, успешные сессии чаще связаны с предметными знаниями. Экспертные сессии показывают более чем вдвое больший уровень подтвержденного успеха по сравнению с новичками. В случаях проблем, новичкам гораздо чаще приходится сдаваться. Такой режим взаимодействия более очевиден: эксперты могут управлять Claude с помощью каждой команды, чтобы добиться большего. Поэтому способность привести Claude к успеху больше зависит от владения предметной областью, чем от навыков программирования. Люди, обладающие такими знаниями, могут выполнять задачи, ранее недоступные. Те, у кого этих знаний нет, — используют инструменты менее эффективно. Основной источник выгоды — это компетентность, а не мастерство. Понимание предмета уже приносит большую часть результата; глубокая специализация — лишь небольшое дополнение.

Эти выводы — лишь начальные. Как и большинство исследований, мы не можем оценить реальные результаты в мире: использовался ли сгенерированный код, был ли он применен, принес ли он экономическую выгоду. Также в докладе исключены неинтерактивные сценарии, которые составляют значительную часть активности. Создание системы оценки таких случаев — одна из задач будущего. Все наши классификации основаны на чтении сессий моделью. В приложении показано, что классификатор и независимые телеметрические данные в основном совпадают, и в большинстве случаев — с сильной точностью. Но в масштабных сценариях проверка классификатора сложна; сессии Claude Code часто слишком длинные и сложные, чтобы их можно было точно аннотировать вручную.

По мере развития моделей, изменения в пользователях и разделении труда, картина, представленная в этом отчете, будет обновляться. Надеемся, что эти показатели помогут отслеживать важные перемены: если в будущем отдача от профессионального уровня начнет снижаться, это укажет на то, что модели начинают принимать ключевые решения вместо человека, и выгода расширится с узкой профессиональной группой на более широкую аудиторию. Если доля успешных сессий вне программных профессий продолжит расти, это может означать, что программирование становится частью обычной работы в разных сферах, а не только узкой профессией. Эти перемены повлияют на то, кто и насколько сможет извлечь пользу из агентного программирования, и на важнейшие навыки на рынке труда.

[Ссылка на оригинал]

Кликните, чтобы узнать о вакансиях в BlockBeats

Присоединяйтесь к официальному сообществу BlockBeats:

Подписка в Telegram: https://t.me/theblockbeats

Группа в Telegram: https://t.me/BlockBeats_App

Официальный аккаунт в Twitter: https://twitter.com/BlockBeatsAsia

Кто лучше всего использует Claude Code? Ответ может быть не программистом

Ключевые открытия

Введение

Распределение труда

Что делают люди с Claude Code

Кто принимает решения

Профессиональный уровень

Кто использует Claude Code и зачем

Пользователи

Работа

Успех зависит от того, что привносит пользователь

Профессиональный уровень и отдача

Профессия важнее, чем уровень

Перспективы

Популярные темы

MyGateTradeStory

USIranTalksPostponed

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

TradFiCFDGoldMaster

Закреплено