Кими не имеет права на DeepSeek

Лань Си

2024

Возможно, вы еще помните, что в еще не таком далеком 2024 году Kimi была китайской AI-звездой первой величины: раунд финансирования на 1 миллиард долларов, многократные «лимитки» по акциям, связанных с Kimi, ввод на 2 миллиона знаков, который затмил GPT, и агрессивная стратегия продвижения с помощью закупки трафика.

Но тогда полученная ими узнаваемость намного превосходила собственное технологическое влияние.

На самом деле, у той модели на 2 миллиона знаков впоследствии оказалось почти никому не нужно пользоваться. Позже выяснилось, что это была экспериментальная модель: каждый запуск стоил почти трехзначную сумму, и она совершенно не подходила для крупномасштабного обслуживания пользователей.

Тогда техническое сообщество относилось к Kimi с пренебрежением.

Но за счет рекламного шума вокруг «2 миллионов знаков» Kimi все равно закрепилась под ярлыком «длинный текст» и в сознании пользователей.

2025

В начале 2025 года на сцену внезапно вышла DeepSeek, и именно благодаря реальной силе в технологиях она стала «лицом» китайской AI-сферы.

К середине 2025 года ходили новости, что у Kimi уже почти год не было никакого финансирования. «Поливание холодной водой» стало основной темой: люди начали уходить, и в индустрии в целом проекту уже вынесли приговор.

Если вы с середины 2025 года ушли в «затвор» на 9 месяцев и в марте 2026 года смотрите новости:

  • Новая оценка Kimi — 1200 миллиардов;
  • Доход Kimi за 20 дней превысил доход за прошлый год;
  • Модель Kimi была «обклеена» в модуль самой популярной AI-инструментальной разработки для программирования Cursor, получившей оценку 350 миллиардов, и это подтвердилось (так как вы закрывались на 9 месяцев, вы не знали, что самая популярная AI-среда для программирования уже стала Claude Code, а Cursor уже заняла второе место);
  • Новая модель Kimi подняла на себе 20% интернет-трафика, а рыночная стоимость превысила 5000 миллиардов — Cloudflare ввела ее как основную модель;
  • Новая модель Kimi стала единственной открытой и китайской моделью, которую глобальнейшее приложение для поиска независимого AI Perplexity внедрило у себя;
  • Новая технология Kimi «residuals внимания» начала перестраивать архитектуру deep learning, закладывая фундамент, над которым работали больше 10 лет, и была отмечена похвалами от бывшего сооснователя OpenAI Андрея Карпати, от отца модели для вывода OpenAI Джерри Тьюорека и даже от Маска;
  • Ян Чжилин стал представителем глобальной независимой компании больших моделей, которого единственного пригласили выступить на ежегодной конференции NVIDIA GTC 2026…

Вполне возможно, вас это ошарашит.

Все говорят: «AI день — человеческий год». В сфере AI за 9 месяцев действительно произошло много всего.

Но в конечном счете есть одна вещь: парадигма технологий AI изменилась. Самое частое и самое ленивое обобщение этого изменения — от Chat к Agent.

Для 30 миллионов программистов по всему миру изменение такое: самый почитаемый инструмент сместился с Cursor на Claude Code.

Для тех early adopter, которые всегда первыми принимают новые технологии, изменение — это все чаще открывать тот самый черно-белый терминал командной строки, похожий на DOS…

Для AI-компаний изменение состоит в том, что все постепенно обнаружили: модель, которая умеет лучше болтать, намного менее ценна, чем модель, которая умеет писать код и вызывать инструменты.

Самый крутой продукт сменился с ChatGPT на Claude Code, а самая крутая стартап-компания — с OpenAI на Anthropic.

Вернемся к китайскому рынку в начале 2025 года.

DeepSeek R1 стала невероятно популярной, потому что воспроизвела и открыла исходный код «глубокого размышления» OpenAI o1, и еще один продукт «универсального Agent» — Manus — тоже внезапно появился…

В то время большинство китайских AI-компаний занимались тем, что воспроизводили DeepSeek R1 и выпускали новые модели с «глубоким размышлением». Лишь немногие компании понимали: тот модельный движок, который стоит за Manus, — это то, что действительно стоит «воспроизводить» с привлечением ресурсов. Или они это понимали, но им не хватило достаточно ресурсов либо не нашли способа.

Огромная ценность Manus в том, что он визуально демонстрирует многоходовые возможности вызова инструментов модели Claude. Как один технический эксперт большой модельной компании писал в собственном блоге: «Большинство продуктов Agent — без Claude это просто ничто».

Только к июлю 2025 года в Китае тихо появился первый модельный продукт, который сделал ставку на способности Agent. 11 июля Kimi K2 была выпущена с лозунгом Open Agentic Intelligence. Здесь явно скрывались их амбиции: воспроизвести возможности Agent модели Claude и открыть исходный код. Это было похоже на то, как DeepSeek R1 воспроизвела OpenAI o1 и открыла исходный код.

Через 5 дней после релиза — 16 июля — британский научный журнал Nature обнаружил ценность этой модели и описал ее как «еще один момент DeepSeek».

Через 10 дней после релиза — 21 июля — сооснователь Anthropic Джек Кларк в своем блоге представил K2 и дал оценку:

«На мой взгляд, Kimi — неплохая модель, отстающая от самой передовой Америки на несколько месяцев, продолжающая траекторию DeepSeek. Ее оценки по кодированию и вызову инструментов уже достаточно высоки. Я ожидаю, что в реальной жизни ею кто-то действительно будет пользоваться, поэтому наблюдение за темпами ее внедрения отражает конкурентоспособность».

В конце июля Ян Чжилин в подкаст-интервью объяснил, почему K2 не сделали сначала «глубокое размышление», а вместо этого сделали упор на способности программирования и вызова инструментов, которые нужны Agent. Он назвал модель, ориентированную на «глубокое размышление», «мозгом в банке». И да: интервью Ян Чжилина стоит посмотреть несколько раз. Он рассказал много о технических вещах, которые куда более сущностные — например, о связи программирования и Agent, а также о связи размышления и вызова инструментов.

Из-за результатов K2 и последующих моделей K2 Thinking финансирование Kimi наконец возобновилось к концу года: 500 миллионов долларов, IDG и несколько давних акционеров продолжили поддержку.

2026

Перед и после китайского Нового года 2026 года этот безумный сезон релизов больших моделей: Kimi оказалась первым участником, сдавшим работу. Возможно, это было еще и то, что сильнее всего мучило конкурентов: K2.5 в 5,0 триллиона параметров, многомодальное понимание изображений и видео, а также поддержка режимов и с размышлением, и без размышления. Другие стартапы-конкуренты выпускали только текстовые модели. У компании с закрытым кодом — у крупных заводов — единственное, что могло встроить многомодальные способности в флагманскую модель.

16 марта команда Kimi опубликовала технический доклад по Attention Residuals, бросив вызов уже существующему механизму базовых residual connections в нейросетях, который держится на протяжении 10 лет. Сооснователь OpenAI Андрей Карпати резко оценил Kimi: «Она заставляет нас понять, что мы так и не до конца разобрались в том, что же на самом деле значит Attention is All You Need». Ведь Attention is All You Need — это священный грааль, который открыл эру больших моделей. Даже если учесть раздувание «общепринятых слов» в AI-сообществе, эта оценка все равно беспрецедентно высокая. Говорят, что первый автор статьи — школьник, которому всего 17 лет, талант «вышел из подростков», и это, правда, вызывает восхищение.

17 марта модель Kimi после CES 2026 в начале года снова стала «моделлю по умолчанию» компании NVIDIA для демонстрации следующего поколения чипов и производительности в логике вывода — на главном выступлении GTC 2026 Хуанжэна Сюня.

18 марта, выступая как единственный приглашенный представитель китайской независимой компании больших моделей на ежегодной конференции GTC NVIDIA, Ян Чжилин на сцене сделал доклад, полностью наполненный практикой: с самого начала он сопоставил три ключевых блока — оптимизатор, механизмы внимания и residual connections — с устаревшими техническими стандартами, которым 8–11 лет; это, по его словам, становится препятствием для продолжения Scaling. И это требовало прорыва новыми технологиями, чтобы показать: «каждая базовая технология заслуживает того, чтобы ее снова осмыслить».

А затем — дело последних дней, всем известный «скандал с Cursor»: кто бы мог подумать, что Cursor — крупнейший в мире ассистент для программирования с оценкой в 50 миллиардов долларов — с громким релизом следующего поколения своей компиляционной (composer) модели Composer 2 — с результатами бенчмарков выше Claude Opus 4.6 — на деле оказался «обернут» оболочкой Kimi K2.5…

Поскольку Cursor позиционируется как посредник по токенам, ей нужно было сделать ставку на «самостоятельную разработку» в основном ради того, чтобы уйти от сильной зависимости от Anthropic и OpenAI. «Запирание горла» — это не вопрос страны: Anthropic действительно когда-то прекращал поставки таких инструментов программирования, как Windsurf. В среде, где одновременно вы выступаете судьей и спортсменом, настроение Cursor, желающей быть независимой и самодостаточной, полностью понятно.

Но огромная пропасть между возможностями и видением заставила Cursor выбрать стратегию «стереть» название базовой модели Kimi, полагаясь на услуги копирайтера, чтобы привлечь финансирование. В итоге история завершилась довольно прилично: сооснователь Cursor публично извинился, в техническом отчете он дал подробные причины выбора Kimi K2.5 в качестве базовой модели. А официальный Kimi ответил, что рад, что Cursor использует Kimi K2.5 как базу, и что обе стороны через провайдера услуг для рассуждений Fireworks AI оформили техническую лицензию.

Согласно слухам, перед китайским Новым годом 2026 года и вскоре после него Kimi последовательно завершит финансирование с оценкой 4,8 миллиарда долларов, 6 миллиардов долларов и 10 миллиардов долларов, доведя общий объем до почти 2 миллиардов долларов; доля раунда в 18 миллиардов долларов, стартовавшего в марте, тоже нужно будет дождаться очереди, чтобы ее получить.

Конечно, этому помогло и сверхобычное выступление двух конкурентов на рынках Гонконга, но еще важнее — реальная фактическая производительность собственной K2 и последующих моделей. Это включает вышеупомянутые события с Cursor, Cloudflare, Perplexity, Хуанжэнем Сюнем, Маском, Марком Андресеном, Чамасом и т.д., которые постоянно присылали «дождь из денег», а также финансовые показатели: через 20 дней после релиза K2.5 доход превысил доход за прошлый год.

Один из друзей Kimi в частной беседе сказал: «Ограничивает развитие бизнеса только вычислительная мощность. Сейчас как минимум еще есть спрос, который в 10 раз больше, чем удовлетворяется. Сколько карт — столько и дохода». Из того, что я узнал от другого друга, который работает в крупной компании, сейчас некоторые из крупных компаний встраивают в инструменты программирования модель Kimi — и даже нужно оформлять предзаказ, чтобы получить достаточно квоту.

Эти 9 месяцев Kimi можно сказать, что прошла один раз «изменение судьбы до абсурда».

Судьба

DeepSeek V3 не была вылеплена за один день. Унаследованные за ней гены квантовой (фантастической) количественной оценки (Quant), определили: начиная с 2023 года они выбрали путь, совершенно отличный от Кремниевой долины — путь к максимальной энергоэффективности. В течение большей части периода 2023–2024 годов они находились вне основной линии нарратива, занимаясь разработкой собственного MLA (мульти-головного скрытого механизма потенциального внимания) и архитектурой DeepSeekMoE, пытаясь выжать производительность, превосходящую физический предел, при ограниченных вычислительных ресурсах. Лишь в 2025 году они добились результатов для себя — и тем же дали уверенность другим стартапам в AI.

Все ждут, что следующее поколение моделей DeepSeek продолжит удивлять всех, но многократно повторяющиеся в медиа спектакли с «волками пришли» лишь размывают внимание людей. Технологический прорыв — разве это так легко? У нас есть полное право и даже причина быть еще более терпеливыми и ждать следующую работу команды DeepSeek.

Kimi K2 тоже не была сделана за один день. По сути, они выпустили модель K1.5, которая осталась незамеченной, в тот же день, что и DeepSeek R1, и OpenAI официально сочла, что это были две компании, которые первыми воспроизвели o1. В то время, когда их в 2025 году в начале самого сильного «поливания» скепсисом, они выпустили серию Moonlight: небольшие MoE-модели, чтобы проверить технологию следующего поколения второго уровня оптимизаторов — и в итоге применить ее к модели K2, которая стоит на уровне триллиона. Теперь Muon заменил уже использовавшийся 10 лет стандартный технологический модуль Adam и стал новым стандартом, который начали использовать в новых моделях, включая Kimi, GLM-5 и DeepSeek Engram.

Как говорится, «выходя в мир, всегда нужно кому-то платить по счетам». Kimi в 2024 году заранее получила C-позицию и максимальную огласку, а в 2026 году уже не стала повторять тот трафик, который принадлежал ей.

У каждой — своя судьба.

Будучи двумя стартапами, которые стартовали почти одновременно, я восхищаюсь тем, как они никогда не считают, что расклад сил на рынке уже определен. Они верят, что именно технологии — главный фактор неопределенности, у них есть смелость гнаться за AGI. Их достижения можно проверить, они молоды и «горят»; и они навсегда верят в то, что тонкая струйка со временем дает результат.

Даже если смотреть на временную отметку конца марта 2026 года, эта AI-революция, начавшаяся в конце 2022 года, длится всего 3,5 года — и все лишь начинается. Почему следующий OpenAI и Anthropic не могут быть китайской компанией?

Огромное количество новостей и точная интерпретация — всё в приложении Sina Finance APP

Ответственный: Ян Ци

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.26KДержатели:2
    0.07%
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.23KДержатели:0
    0.00%
  • Закрепить