Лише Vibe Coding — не станеш експертом! Anthropic розкриває правду: професійні знання важливіші за написання коду

Звіт вказує, що при використанні штучного інтелекту для написання програм важливішими є галузеві знання та здатність до прийняття рішень, ніж навички програмування. Маючи професійне судження та здатність ставити правильні питання, можна значно підвищити ймовірність успіху завдання.

16 червня Anthropic опублікувала дослідження «Agentic coding and persistent returns to expertise» (агентне кодування — це «завдання на виконання», коли ви даєте команду, а ШІ сам читає файли та виконує команду, щоб зробити роботу).

Звіт аналізує близько 235 тисяч користувачів та приблизно 400 тисяч взаємодій з Claude Code з жовтня 2025 по квітень 2026 року, і прагне відповісти на одне з найбільш тривожних питань: чи справді люди без формальної програмістської підготовки можуть керувати ШІ для виконання складних технічних завдань?

Відповідь у звіті позитивна, але справді важливим є висновок: не так важливо вміти писати програми, як розуміти, що саме ви намагаєтеся зробити.

«Кожен може писати програми» — ця фраза лише наполовину вірна

За минулий рік «vibe coding» (писання коду на основі інтуїції — описуєш природною мовою, що потрібно, і ШІ сам генерує робочий код, не обов’язково розуміючи кожну стрічку) став популярним у спільноті розробників. У відповідь на цю тенденцію найпоширенішою історією стало: бар’єр для написання коду знищено, тепер кожен — інженер.

Хто виграє від цієї історії? Виробники інструментів ШІ, а також керівники, які більше не наймають інженерів — це хороші історії. Але дані звіту пропонують більш прагматичну версію.

Anthropic оцінює кожного користувача у кожній взаємодії за п’ятьма рівнями «від новачка до експерта», базуючись на транскриптах. Важливо розуміти, що цей рівень професійної підготовки не співвідноситься з посадою чи рівнем інтелекту, а є специфічним для конкретного завдання.

Звіт наводить ключовий приклад: бухгалтер, який ніколи не працював з Python, але чітко пояснює правила звірки та може виявити помилки в межах місячного звіту — він у цьому завданні — експерт. Навпаки, досвідчений інженер, який вперше запитує про Rust, — новачок.

Інакше кажучи, «професійність» тут — не в тому, щоб писати код, а в тому, наскільки добре ви розумієте «саму проблему». Саме тому зводити це до «кожен може замінити інженера» — помилка: галузеві знання — це довгострокова професійна компетенція, яка не зникає, а просто стає вузьким місцем.

Як виглядає розподіл праці: ви ставите питання, ШІ відповідає

Найяскравіша ілюстрація — схема розподілу рішень між людиною та ШІ. Anthropic розбиває кожне рішення на «планування» (що робити, яким методом, як визначити завершення) та «виконання» (змінити файл, написати програму, використати певну мову). В результаті: у середньому людина приймає близько 70% планувальних рішень, Claude — близько 80% виконавчих.

Джерело: Anthropic

Проще кажучи, люди відповідають за постановку задач і перевірку, а ШІ — за технічну реалізацію. І чим більш досвідчений користувач, тим більше схильний «відпустити» цю частину: звіт показує, що новачки кожною командою запускають у середньому близько 5 дій і отримують близько 600 слів відповіді; експерти — близько 12 дій і 3200 слів. Досвідчені користувачі здатні делегувати більшу частину роботи, оскільки добре вміють формулювати запити та перевіряти результати.

Джерело: Anthropic

Це перша несподівана для багатьох частина звіту: чим сильніший ШІ, тим більше «розкручений» інструмент для досвідчених користувачів — не зменшується, а зростає їхній вплив.

Реальні відмінності — у рівні успішності

Anthropic використовує два критерії для оцінки «успіху» розмови. Найм’якший — «частковий успіх»; найжорсткіший — verified success (підтверджений успіх), що означає, що не лише ШІ сам визначив завершення, а й є підтвердження у вигляді комітів у git, проходження тестів або явного підтвердження користувача.

За найжорсткішою оцінкою: у новачків verified success — лише 15%, у середньому до експертів — 28-33%. За більш лояльною — відповідно 77% і 91-92%.

Джерело: Anthropic

Але є важливий нюанс: найбільший приріст спостерігається саме у «від новачка до середнього рівня», тоді як далі — крива майже вирівнюється. За словами звіту, достатньо мати базове розуміння галузі та вміння швидко взятися за справу, щоб отримати більшість переваг; глибока експертиза дає лише невеликий додатковий ефект.

Різниця також проявляється у тому, хто витримує труднощі. Коли виникають проблеми (помилки, невдачі тестів, повторні спроби), 19% новачків одразу здаються і не пишуть жодного рядка коду; у досвідчених — лише 5-7%. Звіт інтерпретує це так: здатність повернути розмову у правильний напрямок — теж частина професії.

Недооцінений висновок: професійні відмінності — значно менші, ніж здається

Якщо програмістські навички справді були б вирішальними, то інженери мали б значно переважати. Але дані цьому не підтверджують.

У діалогах, що генерують код, успішність серед професій — близько 34%, інші — 29%, різниця всього 5%, і ця різниця за останні сім місяців не зросла і не зменшилася.

Звіт аналізує топ-10 професій у даних, і всі вони мають рівень успіху в межах 7% від показників інженерів. Навіть більш несподівано — менеджери мають рівень успіху, що трохи вищий за інженерів.

Звіт пропонує дві можливі причини: по-перше, навички «керівництва, постановки задач, визначення цілей» у менеджерів вже давно застосовуються для керування ШІ; по-друге, можлива похибка у вимірюваннях, оскільки частина підтверджень базується на явних заявах користувачів у діалозі «так, саме так», а менеджери звикли формулювати все чітко.

За останні сім місяців також спостерігається зміна у часі: частка діалогів, присвячених налагодженню (debugging), зменшилася з 33% до 19%, майже наполовину; натомість, частка операцій з запуску та налаштування (deployment, configuration) зросла з 14% до 21%, а писання та аналіз даних — з близько 10% до 20%.

Звіт оцінює цінність кожного завдання, порівнюючи з ринковими цінами на фрілансі, і показує, що середня вартість завдання за цей період зросла приблизно на 27% (у підсумку — близько 25%).

Що цей звіт не каже, але варто замислитися

Звіт визнає свої обмеження: він не може оцінити реальні результати у світі — чи використовувалися згенеровані програми далі, чи були вони застосовані у реальних проектах; також він виключає «неінтерактивне» використання (наприклад, інтеграція Claude Code у автоматизовані процеси), що є значною частиною. Всі класифікації базуються на аналізі транскриптів, тому це — «ранній знімок», а не остаточна оцінка.

Ще важливіше для фахівців — питання, яке закінчує звіт. Anthropic заявляє, що вони будуть постійно слідкувати за ситуацією: якщо «віддача від галузевих знань» почне знижуватися, це означатиме, що модель здатна самостійно генерувати ті судження, які раніше вимагали людського внеску.

Висновок: вам не потрібно панікувати через незнання програмування — краще інвестувати у глибше розуміння своєї галузі та чіткіше формулювати, що саме вважаєте правильним.

Спершу сформулюйте проблему, потім довірте її ШІ для прискорення; спершу перевірте результати, і вже потім відпускайте.

  • Статтю надано з дозволу: «Цифрова епоха»
  • Оригінальна назва: «不能只懂寫Code!Anthropic揭Vibe coding真相:比起coding,「本業知識」才是最大槓桿»
  • Автор: Лі Сянтай
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено