Стоимость API резко выросла, разработчики начали переносить вычисления обратно на локальные устройства, и инфраструктура Web3 неожиданно получила выгоду.

robot
Генерация тезисов в процессе

Платежи за передовые модели подталкивают разработчиков к локальному использованию

Илон Маск упомянул, что в сценарии OpenClaw примерно ежедневно сжигает на расходы по моделям около 200 долларов. Это не просто вопрос траты денег — это отражает более крупную тенденцию: разработчики уходят от одних лишь облачных решений к гибридной маршрутизации «локально + облако». Похожих историй становится все больше: API-биллинг слишком высок, компании попросту не тянут, поэтому разработчики переносят ежедневные задачи и те рабочие процессы, которые можно пакетировать, в локальную среду, а к передовым моделям обращаются только для действительно сложных вещей.

В недавнем разборе Виталик Бутерин заострил внимание на Qwen3.5, которая работает на оборудовании Nvidia и с изоляцией в песочнице: скорость вывода может достигать 90 токенов в секунду, и при этом она не использует публичное облако. Это перекликается с отчетом CertiK — они обнаружили, что в навыках OpenClaw около 15% связаны с вредоносными намерениями «вытянуть кошелек». Конфиденциальность и безопасность уже перестали быть темами на периферии внимания.

Что касается вирусного твита Марка Андриссена про «AI-психоз», честно говоря, он мало связан с реальным внедрением. Главный драйвер все равно экономический учет: по оценкам сообщества, когда открытые модели запускаются локально для некритичных задач, затраты можно снизить примерно на 90%.

  • Гибридная маршрутизация стала настройкой по умолчанию: как такие разработчики, как Matthew Berman, переносят в локальную среду задачи вроде извлечения текста, а «твердые орешки» вроде генерации кода оставляют передовым моделям. Затраты резко падают, а маржинальность API-платформ лабораторий сжимается.
  • Проблемы безопасности переписывают торговые преимущества: подход Виталика — это «двойное одобрение человек+LLM» плюс дневной лимит в кошельке 100 долларов. Он рассматривает автономию агента как риск, который нужно контролировать, а не как дополнительное торговое преимущество. Это также подталкивает Web3-проекты (например, 0G Labs) предоставлять проверяемые результаты.
  • Web3 AI остается недооцененным: пока все смотрят на Polymarket и Bitcoin, такие проекты в экосистеме Solana, как Bertram The Pomeranian, объединяют Meme и AI-инструменты. Роль криптовалюты в децентрализованной инфраструктуре агентных систем, судя по всему, рынок пока серьезно не рассматривает.

Жар вокруг Agent сталкивается с реальными затратами

Эта тема распространилась из‑за ответа Андриссена на тему «AI-истерики». Оптимисты приводят Clawptimizer.ai и говорят, что можно сэкономить 90% затрат; скептики же усиливают предупреждения CertiK о захвате сессий в плагинах. В итоге получается следующее: OpenClaw растет быстро, но у этой двуединой пилы — если данные GitHub очень яркие, то при недостаточно хорошо сделанных песочнице и изоляции прав скорость внедрения может замедлиться.

Параллельно то же самое подтверждает и NVIDIA: бесплатные конечные точки Moonshot Kimi и схемы VPS дешевле 5 долларов в месяц тоже созвучны взгляду Маска — цены на передовые модели 5–25 долларов за миллион токенов в сценариях, где Agent работает 24/7, попросту несостоятельны. Локальный инференс на AMD Ryzen может доходить до 51 токена в секунду — ценностное соотношение локального решения растет.

Средства для того, чтобы правильно переоценить гибридный переход по цене, пока не дали. Корпоративные покупатели больше хотят «проверяемый AI», а не «чистую вычислительную мощность», и это делает более гибкие решения с открытым исходным кодом привлекательнее, чем закрытые платформы.

Точка зрения Доказательства Что это значит для отрасли Мое мнение
Ориентация на стоимость (Berman, сообщество) Передовые модели 200 долларов/день vs. локальный MiniMax 788 долларов/год; локальная маршрутизация прогоняет сводки и т.п. задачи Переход от полного облака к многоуровневому выводу, сжатие прибыли API Недооценено: гибридная архитектура снижает риски расширения, лаборатории либо снижают цены, либо теряют клиентов
Ориентация на безопасность (Vitalik, CertiK) 15% вредоносных навыков; внедрение JS в плагинах приводит к тому, что кошелек «вытягивают» Агент воспринимается как поверхность атаки, ускоряя принятие инструментов автономности Отчасти преувеличено, но проблема действительно есть: это не конец света, но «двойное одобрение» станет стандартом
Оптимисты в Web3 (0G Labs и т.п.) Проекты вроде Bertram входят в список AI+Crypto; реализация доказательств уровня L1 дает проверяемые результаты Crypto выступает слоем конфиденциальности и верификации, притягивая AI-разработчиков к DeFi-инфраструктуре Недооценено: связка AI×Web3 может выдать новый протокол уровня 10 миллиардов долларов
Анти-пиар (твит Андриссена про «psychosis») Не связано напрямую с реальным внедрением Сбить градус эмоций и вернуть обсуждение к стоимости и проверяемости Шум: фокус должен быть на стоимости и проверяемости

Ключевое заключение: эта спорная перепалка в виде твита на самом деле демонстрирует переломный момент для гибридного AI. Чтобы контролировать затраты и защищать конфиденциальность, Builder’ы уже начали применять модель «локально приоритет + оркестрация передовыми моделями», но со стороны финансирования и вторичного рынка пока нет синхронизации. Доминирующая роль лабораторий постепенно размывается автономными инструментами и проверяемыми стеками. Для предприятий более разумный выбор — обход API-lock-in через Web3-проверяемый слой.

Важность: высокая
Категория: отраслевой тренд / AI-безопасность / инструменты для разработчиков

**Вывод: ** Builder’ы и фонды на горизонте среднего/долгого срока в этом направлении сохраняют преимущество первопроходцев. Если транзакционные деньги будут делать ставку только на закрытые API-платформы, то курс выбран неверно и время уже упущено. Гибридная архитектура с приоритетом локального выполнения и проверяемая инфраструктура станут источником сверхдоходности в ближайшие 12–24 месяца.

0G-2,85%
SOL-2,33%
BERT-4,48%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$0.1Держатели:0
    0.00%
  • Закрепить