Стаття Google про глобальне зберігання, яка спричинила кризи у світі, викликала академічні суперечки. Китайські вчені стверджують, що вона містить серйозні неточності і не визнає помилок: використовували наш метод, але навмисно уникали схожості.

Журналіст|Юе Чупен

26 березня стаття науково-дослідного інституту Google Research сколихнула глобальний ринок чіпів пам’яті, спричинивши випаровування понад 90 мільярдів доларів ринкової капіталізації у США та Південній Кореї серед великих гравців.

У своїй праці Google стверджує, що новий алгоритм під назвою TurboQuant може стискати використання пам’яті кеша KV для AI великомасштабних моделей до 1/6 від початкового рівня без втрати точності.

Лише через день після цього доцент-дослідник (постдок) Федерального технологічного інституту Цюріха Гао Цзяньян опублікував допис у соцмережах, прямо вказавши на те, що в роботі Google є серйозні академічні проблеми.

Гао Цзяньян зазначив, що Google обходить подібність між алгоритмом TurboQuant і методом RaBitQ, який він оприлюднив під час навчання на PhD у Національному університеті Наньянг (NTU) у Сінгапурі в 2024 році, а також помилково описує теоретичні результати RaBitQ і навмисно формує несправедливі умови експерименту.

RaBitQ — це алгоритм векторного квантування, який може забезпечити надійність пошуку для векторних даних навіть за дуже високого рівня стискання.

Гао Цзяньян також сказав, що команда TurboQuant «впирається в помилку і не виправляє її». Ще до того, як статтю Google TurboQuant офіційно було опубліковано в квітні 2025 року, він уже повідомив про зазначені проблеми електронною поштою, але з боку Google після того, як вони знали про це, так і не було виконано ґрунтовного виправлення у фінальній версії.

29 бересня журналіст «Щоденної економічної новини» (далі — NBD) взяв інтерв’ю в авторів статті RaBitQ Гао Цзяньяна та Лун Ченґа.

RaBitQ — це основна робота Гао Цзяньяна під час навчання на PhD у Національному університеті Наньянг у Сінгапурі, тоді як Лун Ченґ є його науковим керівником на PhD.

Крім того, журналіст «Щоденної економічної новини» також надіслав Google лист із проханням про інтерв’ю, але станом на момент здачі матеріалу відповіді так і не отримали. Як стало відомо, Інститут Google Research збирається представити свою статтю TurboQuant на Міжнародній конференції з навчальних уявлень 2026 (ICLR 2026), яка відбудеться в квітні.

Гао Цзяньян Зображення: надано респондентом

NBD: Коли ви вперше помітили, що в статті Google TurboQuant є проблеми?

Гао Цзяньян: Ще в січні 2025 року співавтор статті TurboQuant Majid Daliri самостійно зв’язався з нами та попросив допомогти налагодити його власну Python-версію, перекладену на основі коду C++ RaBitQ, а також описав детальні кроки відтворення та повідомлення про помилки. Це свідчить про те, що команда TurboQuant добре розуміє технічні деталі RaBitQ.

Після публікації статті TurboQuant у квітні 2025 року ми помітили, що в статті міститься серйозне викривлення опису RaBitQ: RaBitQ подано як grid-based PQ (добуткова квантизація на основі сітки), повністю ігноруючи її ключовий етап — випадкові обертання, а також без жодних виведень чи доказів теоретичні гарантії RaBitQ визначено як «неоптимальні», і в експериментальних порівняннях явно закладено несправедливий дизайн.

Наша перша реакція — розгубленість і жаль: подібність TurboQuant і RaBitQ технічно легко розпізнати, а рівень ознайомленості іншої сторони з RaBitQ значно перевищує рівень звичайних читачів; за таких умов поява настільки систематичного викривленого опису важко пояснити недбалістю.

NBD: Перед тим як публічно заявити, які були комунікації між двома командами?

Гао Цзяньян: Ми провели кілька раундів обговорень, часовий проміжок між ними — понад рік.

У травні 2025 року ми через електронні листи детально обговорили відмінності в експериментальних умовах і оптимальність теоретичних результатів із Majid Daliri, по пунктах прояснюючи неправильні інтерпретації з боку команди TurboQuant; Majid Daliri чітко зазначив, що він доніс результати обговорень до всіх співавторів.

Однак після того, як ми попросили виправити фактичні помилки у статті, він перестав відповідати.

У листопаді 2025 року ми виявили, що TurboQuant уже подано до ICLR 2026 (Міжнародної конференції з навчальних уявлень 2026), і зміст помилок лишився без змін. Тоді ми одразу зв’язалися з PC Chairs (головами програми) ICLR 2026, але відповіді не отримали.

У березні 2026 року після того, як статтю почали масово просувати через офіційні канали Google, ми знову офіційно надіслали лист усім авторам.

Відповідь була така: перший автор Amir Zandieh пообіцяв виправити теоретичний опис і експериментальні умови, але чітко відмовився виправляти обговорення подібності методологій; також він заявив, що готовий робити зміни лише після завершення офіційної конференції ICLR 2026. Ця відповідь нас розчарувала, але й не стала несподіванкою. Очевидно, що інша сторона розуміла, у чому проблема, але обрала мінімальні поступки.

NBD: Яка найкритичніша спільність TurboQuant і RaBitQ?

Гао Цзяньян: Найголовніша спільність полягає в тому, що в обох випадках використовується ключовий елемент: випадкове обертання векторів перед квантуванням (перетворення Johnson-Lindenstrauss), а також застосовується статистична властивість розподілу координат після обертання для побудови оцінювача відстані.

Варто відзначити: у відповіді на рецензування в ICLR OpenReview (платформа, яку в академічному середовищі часто використовують для публічного відгуку на статті) автори TurboQuant описують свою методику так: «Спосіб реалізації такий: спочатку ми нормалізуємо вектори за їхньою L2-нормою, а потім застосовуємо одне випадкове обертання, щоб після обертання кожна компонента цих векторів підпорядковувалась розподілу Beta». Це дуже узгоджується з ключовим механізмом RaBitQ, але в основному тексті статті ця прив’язка так і не була напряму описана.

Це можна зрозуміти за аналогією: припустімо, один кухар уперше опублікував повний рецепт страви; а потім інший кухар опублікував страву, що використовує майже ті самі ключові кроки, але в описі назвав першу як «інший рецепт із гіршим ефектом», не кажучи ні слова про зв’язок між ними.

За відсутності знань про це читач природно не може винести справедливе судження.

Лун Ченґ Зображення: надано респондентом

NBD: Як має бути поводження з такими відносинами відповідно до академічних норм?

Лун Ченґ: Академічні норми вимагають, щоб коли нова робота має істотний зв’язок із наявною роботою в методологічному плані, це потрібно чітко цитувати та прямо обговорювати: зокрема, вказати, у яких аспектах нова робота просунулася вперед, а які аспекти вона взяла з уже існуючої рамки.

У цьому випадку це особливо важливо, бо один із рецензентів ICLR незалежно також вказав у своїх зауваженнях: «RaBitQ та її варіанти подібні до TurboQuant тим, що обидва використовують випадкові проєкції», і прямо вимагав більш ґрунтовного обговорення та порівняння.

Навіть рецензент помітив цей зв’язок, але автори статті у фінальній версії не тільки не додали обговорення — вони перенесли неповний опис RaBitQ, який раніше був у основному тексті, до додатку. Такий підхід суперечить базовим вимогам академічних норм.

NBD: Чому ви обрали публікувати зараз, а не продовжувати вирішувати це в межах академічних каналів?

Лун Ченґ: Ми не пропустили академічні канали; ми обрали публічність у ситуації, коли в академічних каналах процес уже практично повністю завершився.

Ми по черзі зверталися до авторів статті, до ICLR PC Chairs (голів програмного комітету), і вже подали офіційну скаргу до ICLR General Chairs (голів конференції) та Code and Ethics Chairs (голів із коду та етики) із супровідним пакетом повних доказів; також ми розмістили публічні коментарі на платформі ICLR OpenReview.

Але ми також маємо визнати реальність: ми — невелика дослідницька команда в університеті; інша сторона — Google Research. За ресурсами, впливом і правом голосу між нами не було рівності.

Стаття TurboQuant за короткий час у соціальних медіа набрала десятки мільйонів переглядів — це неможливо забезпечити поширенням силами будь-якої університетської лабораторії.

За такої нерівної конфігурації, якщо ми й далі чекатимемо мовчки внутрішніх процедур, неправильна оповідь лише швидше закріпиться як консенсус. Публічний виступ — один із небагатьох способів, якими слабша сторона може відповісти через офіційні канали, коли реакція запізнюється, щоб захистити базові академічні факти.

NBD: Якщо пов’язані проблеми не будуть виправлені, які наслідки це може мати?

Лун Ченґ: По-перше, це систематично спотворить запис академічної історії та змусить наступних дослідників помилково визначити джерело еволюції методологій, а далі — будувати нові роботи на неправильній основі.

По-друге, це послабить механізми стимулювання оригінальних досліджень. Якщо роботу, підкріплену строгими теоретичними виведеннями та що досягає асимптотично оптимальних меж помилки, можна переупакувати та донести до публіки із десятками мільйонів експозицій, але при цьому первинний автор не отримає належного визнання, то шкода академічній екосистемі буде тривалою і глибокою.

По-третє, для сфери векторного квантування, яка зараз швидко розвивається і привертає високу увагу з боку промисловості, некоректне приписування методів прямо вплине на оцінку фахівцями та дослідниками технологічних напрямів і призведе до помилкового розподілу ресурсів.

NBD: Ви вважаєте, що це належить до академічних розбіжностей?

Лун Ченґ: Це вже виходить за межі академічних розбіжностей. Академічні розбіжності зазвичай виникають, коли сторони по-справжньому по-різному розуміють технічний зміст.

Але в цьому випадку в команди TurboQuant є достатні записи про те, що вона розуміла технічні деталі RaBitQ; ми у травні 2025 року електронними листами по пунктах прояснили оптимальність теоретичних гарантій, і Majid Daliri чітко підтвердив, що він довів це всім авторам; також нерівність експериментальних умов була визнана самим автором у листуванні.

За наведених обставин відповідні помилки протягом усього процесу — від подання статті, рецензування, прийняття, публікації до масової розсилки та промо — так і не були виправлені. Ми не схильні робити легкі категоричні висновки, але вважаємо, що для цього набору дій є достатня фактична база, щоб академічна спільнота й відповідні інституції могли незалежно винести судження.

Зображення: акаунт у соцмережах Гао Цзяньяна

NBD: За що відповідають великі дослідницькі інституції, такі як Google Research?

Лун Ченґ: Підтримка з боку великої структури сама по собі створює ефект мультиплікації. Коли стаття просувається через офіційні канали Google, швидкість поширення та охоплення істотно відрізняються від звичайних академічних статей.

За таких масштабів, щойно помилкова оповідь у статті почне поширюватися, вартість виправлення збільшиться в кілька разів. Я вважаю, що великі інституції мають відповідальність перед масштабною зовнішньою промо-розсилкою статті: переконатися, що описи чужих робіт у ній пройшли базову перевірку фактів, а не перекладати цю відповідальність повністю на команди рецензування колег.

Водночас, коли зовнішні дослідники висувають обґрунтовані заперечення, інституція такого масштабу також повинна мати офіційний внутрішній механізм для їх розгляду, а не зберігати мовчання. Це одночасно є відповідальністю перед академічною спільнотою і захистом власної репутації та довіри.

NBD: Чи плануєте ви далі вживати додаткових дій?

Лун Ченґ: Далі ми плануємо опублікувати детальний технічний звіт на arXiv, систематично виклавши зв’язок між RaBitQ і TurboQuant у методологічному плані, а також послідовно, по одному, технічно пояснити три питання, щоб академічна спільнота мала орієнтир.

Ми також розглядаємо можливість повідомити відповідним інституціям через подальші канали, таким як Google Research Escalation Council (Рада з оскаржень досліджень Google). Наша мета завжди — щоб публічний академічний запис точно відображав справжні взаємозв’язки між різними методами, а не створював протистояння.

Надто багато новин, точна інтерпретація — усе в додатку Sina Finance APP

Редактор: Чан Фу-цянь

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити