ЧатГПТ і Клод знищать усю роботу?

a16z співзасновник Джо Шмідт IV зазначив, що лабораторії великих моделей будуть керувати лише горизонтальними завданнями, справжні можливості застосування ШІ ховаються у вертикальних сценаріях та складних робочих процесах.
(Передісторія: Altman скасував пророчество «знищення людства ШІ»: я дуже радий, що помилявся, чи щиро це?)
(Додатковий контекст: Google інвестує у платформу маршрутизації ШІ OpenRouter, оцінка — 1,3 мільярди доларів, зростання на 240% за рік)

Зміст статті

Перемикач

  • Бруківка з жовтих цеглин
  • Інші місця у країні Оз
  • Чому інші місця у країні Оз не будуть захоплені чаклунами
  • Приклад у сфері продажів — корисні поради від виконавчого директора 11x
    • Зосереджуйтесь на результаті
    • Вплив у складних питаннях
    • Бар’єри — не лише для запобігання поганих речей, це саме те, за що клієнти платять
  • Приклад у страховій сфері — корисні поради від виконавчого директора FurtherAI
  • Як визначити, чи ви перебуваєте у інших місцях країни Оз?
  • Обидва можуть (і будуть) перемагати

Засновники та потенційні співробітники постійно ставлять мені одне й те саме питання: Чи є ще простір для побудови застосувань ШІ? Чи OpenAI та Anthropic знищать усе?

За цим питанням прихована особлива «тривога щодо ШІ». Деякі вже зробили висновок, що щоб уникнути вічного низового статусу, єдине місце для довгострокової присутності — це або внутрішні лабораторії, або передові сфери, такі як роботи, жорсткі технології — теоретично все, що «лабораторії не можуть торкнутися».

Якщо кожне програмне забезпечення скоро буде поглинуте, будь то пряме заміщення роботи Codex або Claude, або те, що майбутні моделі зроблять ваші побудови беззмістовними — тікайте швидше!

Слухайте, я майже так само, як і всі, прихильник ідеї переваги ШІ, але вважаю, що вони лише частково праві. Лабораторії справді руйнують значну частину застосувань. Але «рівень застосування» — це не єдина і однорідна можливість. Правильна рамка мислення: ви на «жовтій бруківці» (Yellow Brick Road), або ж у інших частинах країни Оз?

Жовта бруківка — це наш умовний термін для шляху, яким рухаються лабораторії, вони вкладають у нього шалені ресурси. Основна причина, чому лабораторії найкраще вирішують задачі генерації коду, писання або створення зображень, у тому, що ці задачі покращуються разом із зростанням «первинних можливостей моделей»: кожен долар, вкладений у переднавчання та подальше навчання, безпосередньо підвищує якість продукту.

Водночас, інші місця у країні Оз наповнені більш складними, зазвичай вертикальними, проблемами. Це не просто універсальні інструменти для бізнес-користувачів із стандартним набором функцій і доступом до комп’ютерів.

Їх цінність швидше походить не від первинних можливостей моделей (хоча це й важливо!), а від опорної архітектури (scaffolding) навколо них, саме ця архітектура робить вихідні дані надійними, відповідними регуляторним вимогам і придатними для реального застосування у конкретних галузях.

Ми зараз спостерігаємо цю ситуацію у реальному часі: OpenAI та Anthropic фактично передають ринку повідомлення, що вони не можуть вирішити всі проблеми за допомогою універсального AI-компаньйона. Вони вже оголосили масштабні спільні проєкти з розгортання та налаштування моделей для бізнесу. Якщо ви вважаєте, що наступне оновлення моделі все вирішить — ви навряд чи вкладете мільярди доларів у ці проєкти.

Тому, якщо ви хочете заробити на розробці застосувань ШІ — уникайте жовтої бруківки і шукайте можливості у інших частинах країни Оз. Нижче — цінний досвід, який ми та наші інвестори здобули щодо того, що працює.

Жовта бруківка

Якщо ви засновуєте стартап, жовта бруківка — очевидний шлях, але й найнебезпечніший. Візьміть високопродуктивну модель, підключіть готові інтерфейси (наприклад, Google Drive, Slack, Salesforce, Notion, GitHub), і запустіть на її основі якусь агентську (інтелектуальну) оркестрацію. Це справжня магія!

Проблема у тому, що це саме те, що роблять лабораторії через Cowork і Codex. Вони мають модель, що дає їм кращий прибуток, контроль і можливість встановлювати ціни для будь-яких downstream-партнерів.

Але, мабуть, найважливіше — вони контролюють «архітектурний вибір», що визначає, які задачі їхній продукт може ідеально вирішувати. До сьогодні вони зосереджені на «моделі + виклики інструментів (tool calls)», що саме те, що потрібно для рівнинних, низькрокових робіт на жовтій бруківці. Навіть якщо стартапи зможуть частково перевершити Codex або Claude Code, лабораторії мають великі канали збуту і найсильніший бренд у галузі ШІ.

Якщо ви — компанія, що створює застосунки ШІ, і просто копіюєте цю схему, використовуючи ті ж інтерфейси, без підлеглих агентів, глибоких налаштувань і каналів збуту — ви йдете у прірву.

Інші місця у країні Оз

Для стартапів це не кінець світу. За межами жовтої бруківки є великі можливості: там є чіткий шлях здобути клієнтів і вирішити складні задачі.

Ці компанії створюють агентські інтерфейси, інтегруючи моделі у складну мережу інструментів, автоматизації та інтеграцій (тобто — софт). Це робить їхні рішення переважно вертикальними.

Вони можуть зосередитись на багатокрокових і багатопрофільних задачах, створюючи підагенти (sub-agents) для конкретних ролей і вертикалей — це те, що Anthropic і OpenAI не можуть зробити через універсальні платформи: збір контексту з різних систем і маршрутизація його до кількох людей, що мають затверджувати на різних етапах.

Зазвичай це пов’язано з застарілими системами (legacy), що вимагають передбачуваних результатів (без жодної двозначності), і часто безпосередньо впливають на цінні бізнес-результати.

Лабораторії розуміють цінність цих задач: саме тому вони створюють свої віддалені деплоймент-центри і орієнтуються на високорівневий ринок з підсиленим навчанням (RLHF).

Чому інші місця у країні Оз не будуть захоплені чаклунами

Дехто заперечить: до сьогоднішнього дня прогрес у короткострокових моделях і лабораторіях був невигідною ставкою. Вони, ймовірно, стануть сильнішими і зрештою поглинуть ринок застосувань.

Лабораторії, безумовно, будуть прогресувати, але я вважаю, що компанії у інших частинах країни Оз з часом зможуть захиститися кількома способами:

Цикл даних і навчання: більшість знань не зберігається у тренувальних наборах — це неформальні галузеві норми, незафіксовані стандарти і колективна мудрість, що живе у головах фахівців. Це не знайти у відкритих джерелах. Більше обчислювальної потужності не замінить досвіду, що зберігається у «робочих процесах», що існують у реальній практиці.

Є два взаємопов’язані цикли: один — цикл між клієнтами (коли з’являються нові варіанти одних і тих самих задач, що дає ефект складного зростання); інший — внутрішній цикл клієнта (причини прийняття рішень, неозвучені виключення, внутрішні правила компанії, що формуються через реальні взаємодії з системою).

Компанія, яка пропускає 100 разів правки юридичних умов, 1000 разів циклів страхового аналізу або 10 000 разів маркетингових кампаній SDR, вже внутрішньо засвоїла суть задачі — це те, що новий агент не зможе швидко повторити. Оцінювальні набори (Eval sets), маркування вихідних даних і класифікація крайніх випадків формують унікальний для вертикалі набір даних, що стимулює до тонкої настройки (fine-tuning).

Варіативність і складність моделей: лабораторії вже застосовують маршрутизацію — для різних запитів використовують різні рівні моделей, збираючи їх у ансамблі. Але вони не можуть робити «міжпостачальницьку маршрутизацію» або оцінювати конкурента для конкретного підзавдання, або використовувати відкриті моделі для тонкої настройки у найкращих сегментах. Компанії у інших частинах країни Оз підбирають найкращі моделі для кожного підзавдання.

Коли з’являється нова модель, вона також бере на себе неприємну роботу — повторне тестування, переналаштування підказок (prompts) для клієнтів, деплой у виробниче середовище без збоїв. Лабораторії не роблять цього для клієнтів; вони просто продають вам нову модель і кажуть — «переносьте самі». Компанії у інших частинах країни Оз враховують ці витрати.

Оптимізація витрат: запуск кожного запиту на найсучаснішій великій моделі — швидкий шлях до збитковості. Найкращі застосунки ШІ маршрутизують запити між моделями: найскладніші задачі — на передові моделі, більшість — на середні, а для окремих випадків — на менші, кастомізовані або тонко налаштовані моделі.

Лабораторії встановлюють цінову політику: пропонують мінімально можливий рівень інтелекту за X доларів. А компанії у країні Оз — навпаки — знижують ціну для конкретних робочих процесів, залежно від потрібного рівня інтелекту. Це можливо лише тоді, коли ви точно знаєте, що потрібно для кожного підзавдання.

Управління (Governance): контрольна панель для клієнта, що керує застосуванням ШІ у вертикальній галузі — це величезна цінність. Тут зосереджені права, аудит, дозволи агентів і реєстрація їхніх дій.

Оскільки вони мають повний цикл — інструменти, робочі процеси і дані — вони здатні забезпечити визначені результати. Вони також виступають як організація, що несе відповідальність за регуляторні вимоги: закони, HIPAA у медичній сфері, SEC і FINRA у фінансах, страхові регуляції. Директор з інформаційних технологій (CIO) хоче мати партнера, що може чітко прописати у контракті — «ми забезпечуємо відповідність агентів».

Все це зводиться до одного: зосереджуйтесь. Це може бути вертикальна галузь (страхування, право, бухгалтерія), або глибока функція (продажі, підтримка клієнтів, фінанси). Лабораторії не створені для цього. Вони мають бути всюдисущими і обслуговувати кожного — тому вони і будують нову жовту бруківку. Такий підхід обмежує їх у можливості бути у всьому і водночас у всьому бути експертами. Обидва варіанти — неможливо.

Приклад у сфері продажів — корисні поради від виконавчого директора 11x

Як практично мислити цю проблему? Ось кілька порад від Prabhav Jain, CEO 11x:

Зосереджуйтесь на результаті

Тактичний шлях створення компанії, імунної до лабораторій, — починати з реальних «конкретних результатів», яких прагнуть клієнти. Для нас це — допомогти компаніям побудувати більше каналів продажів.

Які активності дійсно формують потік? Розбивайте їх на задачі. Які з них потрібно агентувати, а які — ні? Коли робочий процес містить багато кроків, хаос у входах, важко інтерпретувати статус або є реальні обмеження — один лише модель не допоможе. Це — робота для класичних інженерів-програмістів.

Наприклад, задачі, що ми вирішуємо: пошук потенційних клієнтів за власними сигналами, збагачення даних, глибокий аналіз акаунтів, отримання контексту з CRM, написання повідомлень для конкретних каналів, агент для кваліфікації потенційних клієнтів і системи доставки пошти. Це не задачі, що можна зробити «одним натисканням». Вони вимагають глибокої інженерної роботи. Більша частина реальних робочих процесів — не агентські, і тут лабораторії не мають переваги.

Вплив у складних питаннях

Саме складність — ключ до справжньої бізнес-цінності. Інакше ти будеш мати лише тонкий обгорток (thin wrapper).

Приклад із сфери виходу на ринок (GTM): якщо компанія вже твій клієнт — не потрібно з ним зв’язуватися. Але це не так просто. Що робити, якщо у компанії десятки дочірніх? Якщо CRM — лише домен материнської компанії? Якщо застарілий полігон у системі відправляє холодний лист керівнику з доходом? Вирішення — створити спеціального агента, що враховує цю конкретну проблему, а не просто універсального помічника.

Бар’єри — не лише для запобігання поганих речей, це саме те, за що платять клієнти

Бар’єри — це не просто захист. Вони — запорука довіри і відповідності. Регульовані фінансові послуги, наприклад, вимагають гарантій, що агент може писати лише те, що дозволено, з ким контактувати і які дані використовувати, а всі рішення — задокументовані.

Такий підхід вимагає налаштувань під сценарій і клієнта, постійного аудиту. Тому у нас є фронтові інженери і стратеги впровадження, що адаптують рішення під кожного клієнта.

Приклад у страховій сфері — корисні поради від виконавчого директора FurtherAI

Продажі — лише один приклад. Страхування — інший. Це підтверджує ту саму ідею. Ось думка Aman Gour, CEO FurtherAI:

«Коли ми почали впроваджувати ШІ у справжньому страхуванні, ми почули одне припущення: модель — це і є інтелект, а робочий процес — лише каркас навколо неї.

Чим більше страхових компаній ми залучили, тим більше переконалися, що ця ідея — навпаки. У страхуванні інтелекту багато саме у робочих процесах.

Дві страхові компанії можуть обробляти заявку однаково: подання, перевірка, ціна, підписка. Але шлях — це лише поверхня. Важливі деталі: які ризики потрібно повідомляти, які сигнали про збитки критичні, що робити, коли правила конфліктують, коли потрібне людське підписання, і як зберігати рішення. Це не просто правила у системі. Це SOP, керівні принципи і багаторічний досвід.

Саме тому ми створюємо агентські робочі процеси (agentic workflows). Вони забезпечують повторюваність, аудит і контроль витрат; агенти — обробляють варіативність і виправляють помилки, коли стандартний шлях не працює; люди залишаються у процесі (human-in-the-loop), відповідаючи за відповідальність.

З часом робочий процес стає не просто скриптом, а «операційною пам’яттю» страхової компанії. Це — частина, яку лабораторії важко охопити. Це — результат багатократного запуску у виробництві. Перший запуск не дає конкурентної переваги, але з часом, закритий цикл у виробничому середовищі — це і є справжня перевага.»

Як визначити, чи ви перебуваєте у інших місцях країни Оз?

  • Іспит інструментів і кроків: скільки кроків потрібно? Наскільки складні інструменти? Порівняння: пошук у Google Drive — одноступінчастий, з високою толерантністю до помилок; або ж багатокроковий юридичний перегляд договорів із кількома інструментами, що вимагає затвердження партнерів. Обидва — «агенти», але один — глибока розробка, що потребує років.

  • Тест системи: ви створюєте «систему» для клієнта, що охоплює весь робочий процес — збір даних, управління, запис результатів? Або просто інструмент, що доповнює вже існуючий процес? Якщо система — вона автоматично замінює людину? Висока вартість контракту (ACV) — ознака системи, бо вона замінює людські ресурси. Запитайте себе: якщо лабораторія випустить продукт, що конкурує з вами — чи залишаться клієнти? Якщо так — ви створюєте систему.

  • Хедж-фонд / П&Л: ефективність лабораторії оцінюється за бенчмарками, а у країні Оз — за прибутком і збитком клієнта. Клієнти не цікавляться високими балами моделей у тестах — їх цікавить, чи агент допоміг зробити угоду, чи правильно оновлено контракт. Найкращі агентські компанії працюють так, щоб «перевершити» — отримати «альфу» у порівнянні з ринком і клієнтським прибутком.

Обидва можуть (і будуть) перемагати

Ми побачимо переможців і за жовтою бруківкою, і поза нею. Моделі будуть перемагати, бо мають модель і канал збуту. Але й компанії у інших частинах країни Оз, що створюють «системи роботи» — зможуть перемагати, бо їхні робочі процеси і дані — незамінні.

Майбутні корпоративні рішення з’являться поза жовтою бруківкою.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено