DeepSeek V4 випущено кілька днів тому, і в Кремнієвій долині це все ще обговорюється, що спричинило кілька гострих дискусій: ефективність моделей, структура чіпів, час IPO, тиск відкритого коду на закритий.

29 квітня, відеоблог із Кремнієвої долини 101, запросив архітектора чіпів Сяо Чжізбіня та колишнього дослідника OpenAI Дженні Шяо, які понад годину обговорювали цю тему докладно.

Перевершення відкритим кодом — ваші бізнес-цінності нуль

Найжорсткіше висловлювання у цій розмові — концепція, яку Дженні висунула ще минулого року — kill line (лінія смерті), відкритий код моделей встановлює лінію смерті для компаній із закритим кодом.

"Якщо ви компанія, що створює базові моделі, і вас обійшли відкриті моделі, цінність вашого бізнесу фактично нульова."

Якщо ви — компанія базових моделей, і вас обійшли відкриті моделі, ваша бізнес-цінність безпосередньо зникає.

Це не технічна конкуренція, це лінія життя і смерті.

Дженні навела приклад Anthropic: якщо колись Claude перестане бути найкращою моделлю для програмування, хто ще буде користуватися Claude Code?

З цієї логіки, 24 квітня, після випуску DeepSeek V4, акції та оцінки всіх компаній із закритим кодом у Кремнієвій долині опинилися під серйозним випробуванням: ваша модель ще коштує цю ціну?

Найнаочніше — ціна:

GPT-5.5 коштує вдвічі дорожче за GPT-5.4, професійна версія для довгих текстів коштує 180 доларів за мільйон токенів.

В той самий день вийшов DeepSeek V4. Вхід — 1 юань за мільйон токенів, вихід — 24 юаня за мільйон токенів. Ще більш жорсткий варіант: вхід — 0.2 юаня за мільйон токенів, вихід — 2 юаня за мільйон токенів.

Один у два дорожчий, інший у десять разів дешевший.

Оцінка компаній із базовими моделями — двовимірна — ваша причина існування — найсильніша модель. Якщо вона вже не найкраща, оцінка одразу знижується до нуля. Навіть якщо ви — OpenAI.

Занадто багато грошей — навпаки, не економте

Дженні розкрила у розмові один неприємний для Кремнієвої долини факт:

"У компаній Кремнієвої долини грошей забагато, і через це вони не мають мотивації підвищувати ефективність. Китайські виробники моделей через обмежені ресурси раніше почали інновації у token efficiency."

Обмеження ресурсами — це прискорювач інновацій.

OpenAI з перших днів дотримувалася принципу "рухай швидко, ламай речі", купуючи GPU без обмежень, активно будуючи інфраструктуру. Anthropic навпаки стрималася, бо боялася, що доходи не зможуть їх підтримати, і витрати на закупівлю їх з’їдять.

Результат? За однакового доходу Anthropic демонструє значно вищу капітальну ефективність, ніж OpenAI.

Ще гірше — OpenAI одночасно працює у кількох напрямках: апаратне забезпечення, власні чіпи, додатки для покупок, — але основний досвід ChatGPT не вдалося зробити досконалим. З кінця минулого року багато проектів закрили, серед них і Sora.

Інвестори повністю змінили свою позицію. Раніше вони дивилися на AI-компанії як на "експоненційне зростання — продовжуйте вкладати". Тепер питання інше:

"Ще вкладати 10 мільярдів, 100 мільярдів — де буде маржа? ROI де?"

DeepSeek дає дуже прямий відповідь: можливо, вже недоцільно продовжувати розширювати інфраструктуру.

Інновації — це результат примусу. Саме дешевизна є передумовою технологічної революції.

Кожна промислова революція рухалася не лише технологіями, а й тим, наскільки вони дешеві. Тільки коли технології стають доступними для звичайних людей, вони справді змінюють світ.

Без ефективності — AGI лиш демонстрація

Сяо Чжізбінь після прочитання V4 вважає: "Напрямок передбачуваний, завершеність інженерної реалізації — несподівана."

Усі технічні покращення V4 спрямовані до однієї цілі — token efficiency (ефективність токенів).

Він використовував три підходи:

• Muon оптимізатор: частина тренувальних модулів замінена на традиційний Adam, швидкість зближення підвищена.

Разом ці три зміни ведуть до одного результату: вартість генерації кожного токена стала нижчою, а пам’ять, що використовується під час передбачення, — менше.

Обчислювальні витрати зменшилися до 1/3 від рівня моделей у Кремнієвій долині, пам’ять — до 1/10.

Але справжня тривога від V4 — не лише "економія".

Дженні у розмові неодноразово наголошувала: у епоху чатботів обмежена витрата токенів — це нормально, і користувачі терплять дорожчі моделі. Але у епоху агентів — зовсім інша логіка — розбиття довгих завдань, виклики кількох інструментів, постійне переосмислення і планування — токенів витрачається у 10-100 разів більше.

Якщо кожен токен коштує дорого, модель не зможе довго і глибоко мислити, і не зможе масштабувати обслуговування користувачів.

Тому вона висловила ключову ідею:

Без ефективності — AGI лиш демонстрація. З ефективністю — AGI стане справжнім продуктом.

У епоху агентів ефективність — це частина інтелекту.

Чому Anthropic обігнала до 1 трильйона? Фокус > усе інше

За цей час оцінка Anthropic перевищила OpenAI і піднялася до 1 трильйона доларів.

Дженні назвала три причини, але суть зводиться до п’яти слів: Фокус > усе інше.

Перша — Claude Code.

Чому Claude Code — це "визначальний момент" для Anthropic?

Моделі Anthropic завжди були хорошими, але саме Claude Code — це той продукт, що реально генерує дохід. Засновник OpenClaw Пітер Штайнбергер написав статтю: «Claude Code — це мій комп’ютер».

Якщо модель може писати код, вона здатна виконувати універсальні завдання — оновлювати CRM, пересилати пошту, автоматизувати процеси, — все це базується на коді.

Дженні дуже гостро зазначила: програмування — найважливіший крок до AGI. Той, хто освоїть програмування, стане лідером у епоху AGI.

Друга — довіра бізнесу.

Клієнти з портфеля Дженні постійно повторюють одне й те саме: обираємо Anthropic через зобов’язання безпеки. А ще — справа з позовом до Пентагону, що додатково підтверджує її надійність.

Третя — не робити зайвого.

OpenAI прагне створити "все для всіх", але через розпорошеність ресурсів і втрату технологічної переваги. Anthropic зосереджена на трьох напрямах: безпека, бізнес, програмування.

Інвестори у Кремнієвій долині твердо вірять у один принцип: доходи від бізнесу важливіші за споживчі. Враховуючи, що доходи Anthropic зосереджені у бізнес-секторі, це саме та історія, яку американський капітал цінує найбільше.

Nvidia: короткострокова безпека, довгострокова диференціація ринку

Щодо чіпів — зараз всі вважають, що DeepSeek "відходить від Nvidia".

Але реальність більш складна.

На етапі тренування: Величезний обсяг попереднього тренування V4 без сумніву проходив на великих кластерах NVIDIA. У технічному звіті V4 на сторінках 16 і 20 згадуються TCGenO5 та MegaMoE² — ключові оператори, що глибоко інтегровані у екосистему CUDA.

На етапі адаптації: Huawei Ascend позиціонує себе як "адаптація та подальше тренування/виведення у роботу з нуля", AMD — як "інтеграція оптимізацій у ROCm".

Зверніть увагу — слово "адаптація".

Це означає, що модель вже навчена на кластері NVIDIA. Ascend і AMD просто використовують свої програмні стеки для "інтеграції" цієї вже натренованої моделі. Це зворотна сумісність, а не натуральна заміна.

З цієї точки зору, у короткостроковій перспективі Nvidia має глибоку захисну зону у тренувальному сегменті. Екосистема CUDA — не те, що можна швидко перемістити за рік-два.

Але у довгостроковій перспективі — ринок виведення моделей для передбачення дійсно починає змінюватися.

Після зниження витрат на довгий контекст і увагу, бар’єри для масштабного передбачення значно знизилися. Передбачення вже не залежить від того, хто має більше карт, а від того, хто краще побудував архітектуру. Google TPU, AMD, власні чіпи хмарних провайдерів і навіть національні обчислювальні ресурси — шукають можливості у цій новій реальності.

Той сигнал "80/20", що змушує Кремнієву долину неспокійно

У портфелі Дженні є дані: 80% завдань виконуються на середніх і малих відкритих моделях. Лише 20% — на закритих моделях для найскладніших задач.

Рік тому ніхто не міг уявити цей розподіл.

Зараз у Кремнієвій долині щодня з’являється інформація: "Ми маємо 10 мільйонів доларів у акціях OpenAI, ви купуєте? Або знаєте, хто купує?"

29 квітня у випуску Silicon Valley 101 Дженні підсумувала ситуацію одним реченням:

"DeepSeek — це пістолет, прицілений у спину компаній із моделями у Кремнієвій долині. Якщо вони не рухатимуться швидко, DeepSeek наздожене і знищить їхній бізнес."

Цей пістолет уже заряджений.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
GateCompletesDividendDistribution
202,49K Популярність
#
StrategyBuybackSurges12%
179,77K Популярність
#
IsraelStrikesIranBTCPlunges
67,05K Популярність
#
PredictWorldCupShare20000U
515,71K Популярність
#
TrumpDisclosesOver100MBTCETH
3,83M Популярність

Закріплено

карта сайту

DeepSeek ця зброя вже притиснута до потилиці Кремнієвої долини

Перевершення відкритим кодом — ваші бізнес-цінності нуль

Занадто багато грошей — навпаки, не економте

Без ефективності — AGI лиш демонстрація

Чому Anthropic обігнала до 1 трильйона? Фокус > усе інше

Nvidia: короткострокова безпека, довгострокова диференціація ринку

Той сигнал "80/20", що змушує Кремнієву долину неспокійно

Популярні теми

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Закріплено