ChatGPT и Claude уничтожат все работы?

a16z партнер Джо Шмидт IV отметил, что лаборатории больших моделей будут только руководить горизонтальными задачами, а настоящие возможности применения ИИ скрыты в вертикальных сценариях и сложных рабочих потоках.
(Предыстория: Altman отменил пророчество «ИИ уничтожит человечество»: я очень рад, что ошибся, искренне ли это?)
(Дополнение к фону: Google инвестирует в платформу маршрутизации ИИ OpenRouter, оценка — 1,3 миллиарда долларов, рост за год — 240%)

Содержание статьи

Переключить

  • Желтый кирпичный путь
  • Другие части страны Оз
  • Почему другие части страны Оз не будут захвачены волшебником
  • Пример из области продаж — практические советы от CEO 11x
    • Фокус на результат
    • В работе с высокими сложностями
    • Ограждения — не только для предотвращения плохих событий, именно за это платят клиенты
  • Пример из страховой сферы — практические советы от CEO FurtherAI
  • Как понять, находитесь ли вы в других частях страны Оз?
  • Обе стороны могут (и будут) побеждать

Предприниматели и потенциальные сотрудники постоянно задают мне один и тот же вопрос: Есть ли еще пространство для построения приложений ИИ? Или OpenAI и Anthropic уничтожат все?

За этим вопросом скрывается особый «ИИ-тревожность». Некоторые уже пришли к выводу, что, чтобы избежать вечного низшего слоя, единственное устойчивое место — внутри крупных лабораторий или в передовых областях робототехники, жестких технологий и т. п. — теоретически «недоступных лабораториям».

Если каждое программное обеспечение скоро будет поглощено, будь то прямое замещение работы Codex или Claude, или же все ваши построения станут ненужными из-за будущих моделей — бегите скорее!

Слушайте, я почти как все — я сторонник превосходства ИИ, но считаю, что они лишь наполовину правы. Лаборатории действительно захватывают значительную часть приложений. Но «уровень приложений» — это не единая и однородная возможность. Правильная рамка мышления: вы на «Желтом кирпичном пути» (Yellow Brick Road), или же в других частях страны Оз (Oz)?

Желтый кирпичный путь — это наш термин для обозначения направления, в котором движутся лаборатории, вкладывая огромные ресурсы. Они лучше всего подходят для решения задач генерации кода, написания текстов или создания изображений, потому что эти задачи улучшаются по мере повышения «базовых возможностей модели»: каждый доллар, вложенный в предобучение и дообучение, напрямую повышает качество продукта.

В то же время, другие части страны Оз наполнены более сложными, зачастую вертикальными задачами. Эти задачи — не просто универсальные инструменты для корпоративных клиентов с базовым доступом к компьютеру.

Их ценность скорее исходит не из исходных возможностей модели (хотя это важно!), а из поддерживающей инфраструктуры (scaffolding), которая делает выводы надежными, соответствующими требованиям и пригодными для реального внедрения в отрасль.

Мы сейчас наблюдаем, как эта ситуация развивается: OpenAI и Anthropic фактически транслируют рынку сообщение — они не смогут решить все задачи одним универсальным ИИ-коллегой. Они объявили о масштабных фронтовых совместных проектах, ориентированных на настройку и кастомизацию моделей для бизнеса. Если вы думаете, что следующий релиз модели решит все — вы точно не станете вкладывать миллиарды долларов в эти проекты.

Поэтому, если вы хотите разбогатеть, разрабатывая приложения ИИ — избегайте Желтого кирпичного пути и ищите возможности в других частях страны Оз. Ниже — практический опыт, который мы и наши инвесторы получили, изучая, что действительно работает.

Желтый кирпичный путь

Если вы начинаете бизнес, Желтый кирпичный путь — очевидный, но и самый опасный. Берете мощную модель, добавляете готовые интеграции (например, Google Drive, Slack, Salesforce, Notion, GitHub), и запускаете на ней некий агентский слой. Магия!

Проблема в том, что это именно то, чем занимаются лаборатории через Cowork и Codex. Очевидно, у них есть сама модель, что дает им лучшую маржу, контроль и возможность устанавливать цены для downstream-партнеров.

Но, что важнее, — они контролируют «архитектуру», определяющую, какие задачи модель может решать идеально. Пока что они тщательно продумали «модель + вызовы инструментов (tool calls)», что идеально подходит для горизонтальных, низкоуровневых задач. Даже если стартапу удастся превзойти Codex или Claude Code, лаборатории обладают мощными каналами распространения и сильнейшим брендом в области ИИ.

Если вы — компания по применению ИИ, копируете этот подход, используете те же интеграции, но у вас нет ни субагентов, ни глубокой настройки, ни каналов распространения — вы, скорее всего, идете в бездонную пропасть.

Другие части страны Оз

Для стартапов это не конец света. За пределами Желтого кирпичного пути есть огромные возможности: там есть четкий путь к созданию собственной клиентской базы и решению сложных задач.

Эти компании строят агентский опыт, интегрируя модели в сложные сети инструментов, автоматизации и интеграции (то есть — софта). Для большинства таких стартапов характерна вертикальная специализация.

Они могут сосредоточиться на многошаговых, мультирольных задачах, создавая субагентов, предназначенных для конкретных ролей и отраслей — то, что не может сделать универсальная платформа OpenAI или Anthropic: сбор контекста из разных систем и маршрутизация его к нескольким людям, которые должны одобрить его на разных этапах.

Это часто включает работу с наследственными системами (legacy systems), где важна предсказуемость результатов (без малейших ошибок), и где результат напрямую связан с ценностью бизнеса.

Лаборатории прекрасно понимают ценность таких задач: именно поэтому они создают собственные аутсорсинговые департаменты и развивают бизнес по усиленному обучению (RLHF) для премиальных клиентов.

Почему другие части страны Оз не будут захвачены волшебником

Некоторые возразят: до сих пор прогресс в области коротких позиций и лабораторий был невыгодным вложением. Они, скорее всего, станут сильнее и в конечном итоге поглотят рынок приложений.

Лаборатории, безусловно, будут развиваться, но я считаю, что компании в других частях страны Оз со временем смогут защититься несколькими способами:

Данные и учебный «фидл» (flywheel): большинство знаний внутри компании не содержится в тренировочных наборах — это неписаные отраслевые стандарты, незафиксированные правила и коллективная мудрость специалистов. Всё это недоступно на публичных сайтах. Больше вычислительных ресурсов не заменит опыт, встроенный в рабочие процессы.

Здесь есть два взаимодополняющих «фидла»: один — межклиентский (чем больше вариантов одной и той же задачи, тем сильнее эффект сложных процентов); другой — внутри клиента (причины решений, неявные исключения, внутренние правила, полученные через реальное взаимодействие с системой).

Компания, которая заставит свой агент пройти 100 раз по юридическим правкам, 1000 раз — по страховым проверкам, или 10 000 раз — по маркетинговым кампаниям SDR, уже внутренне усвоила суть задачи — это то, что невозможно воспроизвести при запуске нового агента. Оценочные наборы (Eval sets), маркировка результатов и классификация крайних случаев формируют уникальный вертикальный «фидл данных», который движет дообучение.

Вариативность и сложность моделей: внутри лабораторий уже идет маршрутизация — разные модели для разных запросов, сбор ансамблей. Но они не могут делать «кросс-производственную маршрутизацию» или оценивать модели конкурентов для конкретных подзадач, или использовать open-source модели для дообучения в узких сегментах. Компании в других частях страны Оз выбирают наиболее подходящую модель для каждой задачи.

Каждый раз, когда появляется новая модель, она должна выполнять «грязную работу» — переоценку при обновлении, перенастройку подсказок (prompts) для крайних случаев, внедрение без сбоев в продакшн. Лаборатории этого не делают для клиента; они просто продают следующую модель и требуют, чтобы вы сами мигрировали. Компании в других частях страны Оз берут на себя эти издержки миграции.

Оптимизация затрат: запуск каждого запроса на самой передовой крупной модели — путь к убыточности. Лучшие компании по применению ИИ используют маршрутизацию между моделями: используют передовые модели для сложных задач, средние — для большинства рутинных, меньшие — для узкоспециализированных или дообученных.

Лаборатории устанавливают цену на базовом уровне: X долларов за минимально доступный интеллект. Компании в других частях страны Оз — наоборот — предлагают минимальную стоимость за конкретный уровень интеллекта, необходимый для рабочего процесса. Это возможно только при точном понимании, какая модель нужна для каждой задачи.

Управление (Governance): контрольная панель для клиента, управляющая запуском ИИ в вертикальной области — тут сосредоточены права, аудит, разрешения агентам и их действия.

Поскольку они полностью владеют инструментами, рабочими потоками и данными, к которым подключены агенты, они могут обеспечить предсказуемый результат. Они также выступают в роли регуляторных субъектов — соблюдение правил в области права, медицины, финансов (SEC, FINRA, HIPAA, страховые законы штатов и т. п.). Директор по информационным технологиям (CIO) хочет иметь партнера, в контракте которого четко прописано «они обеспечивают соответствие требованиям».

Все это сводится к одному: фокус. Это может быть вертикаль (страхование, право, бухгалтерия) или узкая функция (продажи, поддержка клиентов, финансы). Лаборатории не созданы для этого. Они должны быть везде и обслуживать всех — именно поэтому они строят Желтый кирпичный путь. Такой баланс исключает одновременное присутствие везде и глубокую специализацию. Невозможно быть и там, и тут — оба варианта невозможны одновременно.

Пример из области продаж — практические советы от CEO 11x

Как в практике думать об этом? Вот советы от CEO 11x, Прабав Jain:

Фокус на результат

Тактика построения компании, устойчивой к лабораторным экспериментам, — начинать с реально важного для клиента «конкретного результата». Для нас это — помощь в создании большего потока продаж (pipeline).

Что нам нужно — полностью контролировать цепочку действий, которые реально приводят к росту? Разбить каждое действие на задачи. Какие из них требуют агентского решения, а какие — нет? Когда рабочий поток включает много шагов, запутанный ввод данных, сложные статусы или реальные ограничения — один только мощный модельный движок не поможет. Это — задача для классической инженерии.

Например, наши задачи включают: генерацию потенциальных клиентов по кастомным сигналам, обогащение данных, глубокое исследование аккаунтов, получение контекста из CRM, написание сообщений для конкретных каналов, агентскую проверку квалификации потенциальных клиентов и системы доставки писем. Эти задачи — не одностадийные, требуют инженерных решений. В реальных рабочих потоках примерно половина — не агентские, и в этом случае лаборатории не имеют преимущества.

В работе с высокими сложностями

Самые сложные задачи — это те, что действительно создают бизнес-ценность. Иначе получается лишь тонкая оболочка (thin wrapper).

Пример из области выхода на рынок (GTM): если компания уже ваш клиент, не стоит связываться с одним из ее контактов. Но это не так просто на практике. А что делать, если у компании десятки дочерних предприятий? Или CRM содержит только домен материнской компании? Или в системе есть устаревшее поле, которое отправляет холодное письмо (cold pitch) руководителю по доходам, который уже есть в базе? Для таких случаев нужен специально настроенный агент, а не универсальный помощник.

Ограждения — не только для предотвращения ошибок, именно за это платят клиенты

Роль ограждений недооценена. В финансовых регуляциях требования к защите клиента — совсем не те же, что у SaaS среднего масштаба. Ограждения регулируются сценарием использования: кто может писать, с кем связываться, какие данные использовать, как фиксировать решения.

Они должны строиться под конкретный случай, под клиента, и постоянно пересматриваться. Поэтому у нас есть фронтовые инженеры и стратеги внедрения, которые адаптируют решения под каждого клиента.

Пример из страховой сферы — советы от CEO FurtherAI

Продажи — лишь один пример. Страхование — другой, и он подтверждает ту же идею. Вот мнение CEO FurtherAI Аман Гур:

«Когда мы начали внедрять ИИ в реальный страховой бизнес, мы услышали предположение: модель — это и есть интеллект, а рабочий процесс — лишь его каркас.

Чем больше страховых компаний мы обслуживаем, тем больше убеждаемся, что эта идея перевернула причинно-следственные связи. В страховании большая часть интеллекта — внутри самого рабочего процесса.

Две страховые компании могут обрабатывать заявку одинаковым путем: подача, проверка, расчет стоимости, одобрение. Но это — только верхушка айсберга. Главное — все детали: какие риски требуют отчетности, какие сигналы о потерях важны, как решаются конфликты правил, когда нужен человек, и как фиксируются решения. Эти логики не заложены в чистом правиловом движке. Они разбросаны по SOP, руководствам, экспертным мнениям и многолетней практике.

Поэтому мы строим агентские рабочие процессы (agentic workflows). Они обеспечивают повторяемость, аудит и контроль затрат; агенты управляют вариативностью и исправляют сбои; человек остается в цикле (human-in-the-loop), отвечая за ответственность.

Со временем рабочий процесс превращается не просто в сценарий, а в «оперативную память» страховой компании. Это — часть, до которой лаборатории не дотянутся. Только после многократного запуска в реальных условиях можно понять, что именно формирует ценность — и это становится барьером для новых участников.»

Как понять, находитесь ли вы в других частях страны Оз?

  • Тест инструментов и шагов: сколько шагов нужно? Какие инструменты требуются? Сравните: горизонтальный поиск по Google Drive (один инструмент, один шаг, высокая толерантность к ошибкам) и многошаговая правка юридических договоров с проверкой партнеров. Оба выглядят как «агентская работа», но только один — глубокая разработка, требующая лет.

  • Тест системы: строите ли вы «систему» для клиента или просто инструмент? Система — это рабочий поток с данными, управлением и логами. Инструмент — добавка к уже существующему рабочему процессу. Высокий ACV — знак системы, потому что она заменяет человека. Если новый продукт конкурента делает клиента ненужным вашему инструменту — вы строите систему.

  • Тест хедж-фонда / P&L: лаборатории оценивают по бенчмаркам, а другие — по прибыли и убыткам клиента. Важна не точность модели, а то, помогает ли агент торговать, корректирует ли договор. Лучшие агентские компании побеждают в «альфе» — сверхдоходе, измеряемом по прибыли клиента.

Обе стороны могут (и будут) побеждать

Мы увидим победителей как на Желтом кирпичном пути, так и за его пределами. Модельные компании продолжат побеждать, потому что у них есть модели и каналы распространения.

Компании в других частях страны Оз, если создадут систему работы (system of work) — интерфейс для выполнения задач и сбора данных, — смогут победить. По мере развития сложных вертикальных рабочих потоков, эти системы станут ядром клиентского опыта. Исходные модели — заменяемы, а системы — нет.

Следующее поколение корпоративных приложений появится вне Желтого кирпичного пути.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено