Производитель памяти обвалился на сотни миллиардов, и всё оказалось лишь ошибкой?

Торгуйте акциями — смотрите аналитические отчёты аналитиков Golden Qilin: авторитетно, профессионально, своевременно, всесторонне — поможет вам выявить перспективные тематические возможности!

(Источник:NetEase Technology)

Если бы не эта клоунада с TurboQuant от Google, устроенная ими, я бы и не заметил, что мы уже так долго «терпим» ИИ.

В этом месяце, 24-го числа, Исследовательский институт Google (Google Research) внезапно сделал пост и подробно рассказал об алгоритме с названием TurboQuant — алгоритме экстремального сжатия.

Эта публикация очень просто суммирует назначение TurboQuant: он может сжать память KV cache при выводе больших моделей до 3.5 bit (примерно в 6 раз) и при этом почти не теряет точность.

Переводя на нормальный язык: Исследовательский институт Google представил алгоритм, который сильно снижает потребление памяти большими моделями. Раньше то, что удавалось сделать только на 600G памяти, после внедрения этого алгоритма нужно делать всего на 100G!

На следующий день несколько компаний-лидеров в сфере хранения данных, которые в это время ужинали и пели песни во время жарки на костре, увидели, как их акции сразу пошли вниз.

Акции Micron Technology упали на 3.4%, потери капитализации составили 15.17B долларов; SanDisk (SanDisk) в какой-то момент падали на 6.5%, а к закрытию снизились на 3.5%, потеряв капитализацию 3.63 млрд долларов. Western Digital снизилась на 1.63%, потери капитализации — 1.66B долларов.

Источник графика: Sina Finance

Весь ИИ-круг взорвался: все начали анализировать, в чём именно TurboQuant так хорош и как он влияет

Даже CEO Cloudflare опубликовал пост с оценкой, сказав, что это — «момент DeepSeek» у Google.

Многие ребята, увидев эту новость, возможно, захотят рассмеяться в одеяле: сделано отлично! А дальше память, твердотельные накопители — тоже ведь должны падать? Наконец-то «сборщики ПК» должны были дождаться своего часа, не так ли?

Конечно, я тоже надеюсь, что всё будет развиваться в этом направлении.

Чтобы выяснить, может ли реализоваться самое простое моё желание, я специально немного поработал над материалом и изучил, что вообще такое TurboQuant.

Но ещё до того, как я разобрался, что за «Turbo» такой у TurboQuant, произошёл разворот на 180° ——

Вечером 27 марта в 22:00 научный сотрудник-аспирант Федеральной высшей технической школы Цюриха (ETH Zurich) Цзианъян Гао (Гао Цзяньян) одновременно опубликовал посты на Zhihu, X и платформе рецензирования ICLR, обвиняя в серьёзных академических нарушениях ту научную статью, которую Google использовал для представления алгоритма TurboQuant.

Гао обнаружил, что TurboQuant от Google очень сильно «пересекается» с алгоритмом RaBitQ, который сделала его собственная команда, и в основе у них также лежит «случайное вращение плюс преобразование JL».

Если бы это было просто совпадение идей, и дальше всё сходилось бы — ладно, но беспримерным было то, что Гао выложил письма: ещё в январе 2025 года второй автор статьи Google — Majid — специально отправлял письмо, тихо и вежливо прося Гао помочь, как запустить код RaBitQ.

Получается, это неправильно: считать, что Google таким образом полностью «выведал чужие подробности», но при подведении итогов на победной стороне не сказали ни слова о том, что именно сделал другой?

Мало того, что они скрыли источник — команда Turbo Quant от Google вообще проигнорировала установленное математическое доказательство и прямо в статье, по сути, «на словах», в лоб, навешала на Гао его теорию без оснований.

Гао считает, что его алгоритм RaBitQ уже строго доказан и соответствует уровню «первого класса» — топовой конференции по теоретической информатике.

А в итоге команда TurboQuant даже не посмотрела на выводы: при отсутствии каких-либо доказательств прямо в основном тексте они поставили Гао «клеймо» — «теоретически субоптимально, анализ грубый».

Но больше всего, что вывело из равновесия, — это «магический» двойной стандарт в их бенчмарках по скорости.

В статье они хвастаются, что их алгоритм быстрее RaBitQ на несколько порядков, но за кулисами использована крайне неприглядная схема:

Google дал себе вычислительного монстра A100 GPU, а оппонентам поставили CPU с отключёнными многопоточностью.

Кроме того, они не стали использовать готовый, высоко оптимизированный C++ открытый код, и вместо этого настояли на прогоне — с Python-версией, которую сделал второй автор статьи TurboQuant и которая была лишь частично переведена, — а это ещё добавило «debuff» к алгоритму Гао.

В письме за май прошлого года второй автор этой статьи лично признал такую «асимметричную» операцию «одним ядром против многопроцессорных», а также признал, что синхронизировал это с другими соавторами статьи.

Но в окончательно опубликованной статье эта двухслойная информация — «мягкая и жёсткая» — из-за которой и появляется разница на уровне «изменение даёт прирост», была начисто вычищена.

Одновременно авторы статьи TurboQuant отказались признавать, что их алгоритм структурно похож на RabitQ Гао.

Эту статью с явными грубыми ошибками приняли на конференции ICLR 2026, а дальше — уже в результате того, что мы упоминали в начале: через официальный канал Исследовательского института Google началась масштабная промо-кампания этой статьи.

Исследовательский институт Google упомянул только то, насколько TurboQuant «крут», сколько памяти он экономит, но ни словом не обмолвился о тех ошибках в самой статье, которые поддерживают TurboQuant.

Эта промо-активность, с просмотрами в соцсетях уже на десятки миллионов, затем и вызвала колебания на фондовом рынке у нескольких топовых компаний по хранению, о которых речь была на прошлой неделе.

Оценочно Гао, наверное, тоже уже не смог смотреть дальше, поэтому выбрал вариант — публично «закрутить» всё доказательствами.

Тут же рынок хранения данных постепенно пришёл в себя после первой волны колебаний.

В тот же день, когда Amir Zandieh ответил на письмо Гао, Micron Technology (MU) закрылась ростом на 0.5%, объём сделок составил 16.25B долларов, но за эту неделю в сумме всё ещё падала на 15.5%.

Я не знаю, что почувствовали ребята после этой истории.

Мне кажется, я похож на того самого усача в огороде, который реагирует медленнее всех: смотрит, как товарищи уже доели этот «арбуз», и уже собираются переходить к следующему, а сам переживает, что рискует отстать.

Но в итоге оборачиваюсь — а «усячи» уже вовсю стреляют: — Эта «штука» с ядом.

Ещё труднее понять другое: эта спорная статья с явными ошибками и противоречиями была выпущена Google на рекламную раскрутку спустя целый год — а до того, как Гао вышел и «прибил» Google доказательствами, кажется, мы тоже не слышали, чтобы кто-то публично высказывал сомнения.

Рынок молчит — просто трясёт; так называемый «круг ИИ» — это лишь праздник: наконец-то нашёлся тот, кто может вылечить ИИ-модели от их привычки безумно жрать память.

У немногих всё ещё сохраняющих здравый смысл аналитических организаций и у некоторых отечественных авторов, ведущих медиа, это вызвало лишь то, что они тоже указали: это полностью соответствует «парадоксу Джевонса», который давно любят повторять на Уолл-стрит.

TurboQuant действительно снижает стоимость вывода для задач с длинными текстами, но как только порог становится низким, производители обязательно распахнут двери и начнут развивать ——

Сейчас основной стандарт контекстного окна у отечественных моделей — 200K–256K, и немногие способны на 1M.

Но у зарубежных основных моделей уже есть 1M. Скажите, если у них появится этот набор алгоритмов, не захотят ли зарубежные модели расширить преимущество? Не захотят ли отечественные модели наверстать и вырваться вперёд?

Тогда разные мульти-модальные и приложения с длинным контекстом пойдут валом: из-за того, что становится удобнее, растёт число пользователей и сценариев — в итоге реальная потребность в вычислительных мощностях и hardware для хранения не только не сэкономится, а будет буквально «взорвана» огромным объёмом спроса.

Но голоса сомневающихся, действительно ли TurboQuant настолько хорош, похоже, были перекрыты. В итоге огромная часть людей — без проверки и без изучения реальной ситуации в академическом мире — просто приняла, как данность, что TurboQuant от Google действительно сможет изменить мир.

Конечно, говоря это, я не пытаюсь кого-то критиковать: когда я сам впервые увидел репортаж о TurboQuant, я тоже радовался, как ребёнок.

Я хочу подчеркнуть, что эта клоунада с TurboQuant от Google вскрыла нетерпеливость всех по отношению к ИИ:

Чтобы «кормить» ИИ этот аппаратный пожиратель денег, мы уже слишком многое вытерпели.

С конца прошлого года даже такие электронные устройства, как телефоны — почти у каждого по одному — выросли в цене из-за удорожания памяти.

Источник графика «Синь ду»: Ли Циньлин

Тогда характер ситуации изменился — дорогое ИИ наконец-то всё равно вынудило всех платить вместе.

Ирония в том, что до сих пор никто не может чётко объяснить, какую именно производительность даёт ИИ, и насколько он даёт удобство.

Ранней в этом году Anthropic опубликовал сенсационное исследование о влиянии ИИ на рынок труда.

Исследование показало: на данный момент ИИ используют в основном лишь отдельные профессии, а проникновение ИИ в их работу также не так высоко, как предполагалось.

Источник графика: Anthropic

Вот такой отраслевой реальный уровень проникновения невысокий, ИИ помогает зарабатывать в основном немногим, по сути — продукт оказывается не настолько хорош в употреблении; и всё же негативное влияние, которое он приносит, сейчас заставляет платить всё общество…

И в такой момент, если бы нашлось хотя бы одно сообщение, которое говорит мне: «вот кое-что, что уменьшит аппетит ИИ, чтобы больше не тянуло цены вверх вместе со мной» — тогда я, конечно, надеялся бы, что это сообщение правда.

Возможно, именно поэтому ошибочная статья и алгоритм, который так и не был вложен в коммерческую эксплуатацию, смогли поднять такую большую бурю.

Однако, к сожалению, в конечном итоге выяснилось, что это всё — всего лишь недоразумение.

Автор: Ши Ан

Редактор: Заоци & Мило

Огромный объём информации и точная интерпретация — всё в приложении Sina Finance

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить