Статья Google о глобальном хранении акций вызвала академические споры: китайские ученые заявляют о серьезных искажения и отсутствии исправлений — «использовали наш метод, но сознательно избегали сходства»

记者|Юэ Чупэн

26 марта опубликованная в Google Research статья потрясла мировой рынок чипов памяти, что привело к испарению рыночной капитализации более чем на 90 миллиардов долларов у американских и корейских гигантов.

В статье Google утверждается, что новый алгоритм под названием TurboQuant позволяет сжать потребление памяти для KV-кэша AI-больших моделей до 1/6 от исходного объема, не теряя точности.

Спустя всего один день докторант-аспирант Швейцарской высшей технической школы Цюриха (ETH Zurich) Гао Цзяньянь опубликовал на социальной платформе пост, прямо указав на то, что в статье Google имеются серьезные академические проблемы.

Гао Цзяньянь отметил, что Google обошёл вопрос о сходстве алгоритма TurboQuant и метода RaBitQ, опубликованного им в период обучения на PhD в Наньянском технологическом университете (NTU) в Сингапуре в 2024 году, а также ошибочно описал теоретические результаты RaBitQ и, кроме того, намеренно создал несправедливую экспериментальную среду.

RaBitQ — это алгоритм векторного квантования, который способен гарантировать надежность поиска даже при высокой степени сжатия векторных данных.

Гао Цзяньянь также заявил, что команда TurboQuant «признала ошибку, но не исправила её». До официальной публикации статьи Google в апреле 2025 года он уже через письма указал на вышеупомянутые проблемы, но после того, как Google стало об этом известно, компания так и не внесла полную правку в финальную версию.

29 марта журналист 《Ежедневных экономических новостей》 (далее NBD) взял интервью у автора статьи RaBitQ — Гао Цзяньянь и Лун Чэн.

RaBitQ — это основная работа Гао Цзяньянь во время его обучения на PhD в Наньянском технологическом университете в Сингапуре, а Лун Чэн — его научный руководитель на уровне докторской программы.

В то же время журналист NBD также направил в Google письмо с запросом на интервью, но к моменту сдачи материала ответа так и не получил. Сообщается, что Google Research представит свою статью TurboQuant на Международной конференции по изучению представлений 2026 года (ICLR 2026), которая состоится в апреле.

Гао Цзяньянь. Источник изображения: предоставлено респондентом

NBD: Когда вы впервые заметили, что в статье Google TurboQuant есть проблемы?

Гао Цзяньянь: Ещё в январе 2025 года второй автор статьи TurboQuant — Majid Daliri — сам связался с нами и попросил помощи в отладке его собственной версии на Python, переведённой на основе нашего кода RaBitQ C++, а также описал детальные шаги воспроизведения и сообщения об ошибках. Это показывает, что команда TurboQuant хорошо понимает технические детали RaBitQ.

После публикации статьи TurboQuant в апреле 2025 года мы заметили, что в ней описание RaBitQ содержит серьёзные искажения: RaBitQ описывается как grid-based PQ (произведённое на сетке произведённое квантование), полностью игнорируется её ключевой этап случайного поворота, а теоретические гарантии RaBitQ без каких-либо выводов или доказательств квалифицируются как «неоптимальные», при этом экспериментальное сравнение также выстроено явно несправедливо.

Наша первая реакция — недоумение и сожаление: техническое сходство TurboQuant и RaBitQ однозначно различимо, а уровень понимания другой стороны RaBitQ намного выше, чем у обычных читателей. В такой ситуации столь систематические искажения трудно объяснить небрежностью.

NBD: Какие контакты были у двух команд до того, как стороны публично заявили о проблеме?

Гао Цзяньянь: Мы провели несколько раундов коммуникации, и временной диапазон превысил один год.

В мае 2025 года мы провели детальное техническое обсуждение по электронной почте с Majid Daliri относительно различий в экспериментальных условиях и оптимальности теоретических результатов, по пунктам проясняя ошибочные интерпретации команды TurboQuant. Majid Daliri чётко заявил, что результаты обсуждения доведены до всех совместных авторов.

Однако после того, как мы потребовали исправить фактические ошибки в статье, он перестал отвечать.

В ноябре 2025 года мы обнаружили, что TurboQuant подала ICLR 2026 (Международная конференция по изучению представлений 2026), и что ошибочное содержание осталось полностью без изменений. После этого мы связались с ICLR 2026 PC Chairs (председателями программного комитета), но ответа не получили.

После того как в марте 2026 года статья прошла через официальный канал Google и была массово продвигаема, мы вновь официально отправили письмо всем авторам.

Ответ был следующим: первый автор — Amir Zandieh — пообещал исправить теоретическое описание и экспериментальные условия, но при этом чётко отказался исправлять обсуждение методологического сходства, и заявил, что готов внести изменения только после завершения официальной конференции ICLR 2026. Этот ответ разочаровал нас, но и не был неожиданным. Очевидно, что другая сторона понимает, в чём проблема, но выбирает минимальные уступки.

NBD: В чём самое ключевое сходство TurboQuant и RaBitQ?

Гао Цзяньянь: Самое ключевое сходство в том, что обе они используют один и тот же важный дизайн: случайный поворот векторов перед квантованием (преобразование Джонсона—Линденштраусса), и опираются на статистические свойства распределения координат после поворота для построения оценщика расстояний.

Стоит отметить, что в ответе авторов TurboQuant в ICLR OpenReview (платформа, часто используемая в научном сообществе для открытого рецензирования статей) на запрос рецензента собственная методика описана так: «Наш подход заключается в следующем: сначала нормализуем векторы по их L2-норме, затем применяем один раз случайный поворот, чтобы гарантировать, что компоненты этих векторов после поворота подчиняются бета-распределению». Это крайне согласуется с ключевым механизмом RaBitQ, но в основном тексте статьи эта связь так и не была прямо разъяснена.

Можно понять это на аналогии: представьте, что один шеф-повар сначала публично публикует полный рецепт блюда; затем другой шеф-повар выпускает блюдо с почти теми же ключевыми шагами, но в описании называет первое блюдо «другим способом приготовления и с худшим эффектом», не упоминая вообще никакой связи между ними.

Естественно, читатель, не зная об этом, не сможет вынести справедливое суждение.

Лун Чэн. Источник изображения: предоставлено респондентом

NBD: Согласно академическим нормам, как следует обращаться с такими отношениями?

Лун Чэн: Академические нормы требуют, чтобы когда новая работа имеет существенную методологическую связь с уже существующей, эту связь нужно чётко ссылочно указать и открыто обсудить, включая то, что именно в новой работе продвинулось, а какие аспекты продолжили использоваться в рамках уже существующей схемы.

В этом кейсе это особенно важно, потому что один из рецензентов ICLR в своих комментариях независимо также отметил: «RaBitQ и её варианты похожи на TurboQuant именно тем, что в них используются случайные проекции», и явно потребовал более полного обсуждения и сравнения.

Раз рецензент сам обратил внимание на эту связь, то авторы статьи в финальной версии не только не добавили обсуждение, но и перенесли изначально неполное описание RaBitQ из основного текста в приложение. Такой подход противоречит базовым требованиям академических норм.

NBD: Почему вы решили обнародовать сейчас, а не продолжать решать это внутри академических каналов?

Лун Чэн: Мы не пропускали академические каналы; мы выбрали публичность в ситуации, когда академические каналы уже практически полностью исчерпаны.

Мы последовательно связывались с авторами статьи, а также с ICLR PC Chairs (председателями программного комитета), и одновременно подали в ICLR General Chairs (председателям конференции) и Code and Ethics Chairs (председателям по коду и этике) официальную жалобу, приложив пакет полных доказательств. Также мы разместили публичный комментарий на платформе ICLR OpenReview.

Но мы должны признать и реальность: мы — небольшой исследовательский коллектив в университете, а другая сторона — Google Research. По ресурсам, влиянию и праву голоса стороны изначально не равны.

Статья TurboQuant за короткое время набрала десятки миллионов просмотров в связи с обсуждениями в соцсетях — такая способность к распространению недоступна ни одной университетской лаборатории.

В условиях такой асимметрии, если мы продолжим молчать и ждать хода внутренних процедур, неверный нарратив лишь ускорит закрепление в виде консенсуса. Публичное заявление — один из немногих способов, доступных слабой стороне, когда официальные каналы реагируют медленно, чтобы защитить базовые академические факты.

NBD: Если соответствующие проблемы не будут исправлены, какие последствия это может повлечь?

Лун Чэн: Первое: оно систематически исказит запись в академической истории, заставив будущих исследователей ошибочно определить источник эволюции методологий, а затем строить новую работу на неверной основе.

Второе: оно снизит стимулы для исследований оригинального характера. Если работа, прошедшая строгий теоретический вывод и достигшая асимптотически оптимальной границы ошибок, может быть переупакована и выведена на публику с десятками миллионов показов, при этом исходный автор не получит заслуженного признания — ущерб академической экосистеме будет долгосрочным и глубоким.

Третье: для сферы векторного квантования, которая сейчас быстро развивается и на которую в промышленности очень обращают внимание, неверная атрибуция методов напрямую повлияет на то, как практики и исследователи оценивают технические маршруты, что приведёт к ошибочному распределению ресурсов.

NBD: Вы считаете, что это относится к академическим разногласиям?

Лун Чэн: Это уже выходит за рамки академических разногласий. Академические разногласия обычно возникают, когда у обеих сторон есть реальные различия в понимании технического содержания.

Но в этом кейсе у команды TurboQuant есть достаточные документальные свидетельства о том, что она понимает технические детали RaBitQ; мы в мае 2025 года по электронной почте по пунктам прояснили оптимальность теоретических гарантий, и Majid Daliri чётко заявил, что он уведомил всех авторов; неравенство экспериментальных условий также было признано самими авторами в письмах.

При таких обстоятельствах соответствующие ошибки на протяжении всего процесса — от подачи статьи, через рецензирование, принятие, публикацию и массовую публичную раскрутку — так и не были исправлены. Мы не склонны легко давать квалификационные оценки, но считаем, что данная серия действий имеет под собой достаточную фактическую основу для того, чтобы академическое сообщество и соответствующие учреждения могли независимо вынести суждение.

Источник изображения: аккаунт Гао Цзяньянь в соцсетях

NBD: Какую ответственность несут крупные исследовательские организации вроде Google Research?

Лун Чэн: Поддержка со стороны крупной организации сама по себе создаёт эффект усиления. Если статья продвигается через официальный канал Google, то скорость распространения и охват по сравнению с обычными академическими статьями несопоставимы.

在 таком масштабе, как только неверный нарратив в статье распространяется, стоимость его исправления возрастает в несколько раз. Я считаю, что у крупных организаций есть обязанность до масштабного публичного продвижения статьи проверить, что описания работ других людей соответствуют базовой фактической реальности, а не полностью перекладывать эту ответственность на коллегиальные рецензии.

Одновременно, когда внешние исследователи выдвигают возражения, которые можно подтвердить фактами, крупная организация также должна иметь официальные внутренние механизмы для их рассмотрения, а не сохранять молчание. Это одновременно и ответственность перед академическим сообществом, и защита собственной репутации.

NBD: Вы планируете предпринять дальнейшие действия?

Лун Чэн: Дальше мы планируем опубликовать на arXiv подробный технический отчёт, в котором систематически разберём взаимосвязь по методологии между RaBitQ и TurboQuant, и по трём вопросам по очереди дадим технические разъяснения для справки научного сообщества.

Мы также рассматриваем возможность донести информацию до соответствующих организаций по дальнейшим каналам, таким как Google Research Escalation Council (Совет по апелляциям в Google Research). Наша цель всегда заключается в том, чтобы публичная академическая запись точно отражала истинные отношения между различными методами, а не в том, чтобы создавать противостояние.

Огромный поток новостей и точная интерпретация — всё в приложении Sina Finance APP

Ответственный редактор: Чан Фуциан

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить