Google знову випустила "технічне роз'яснення", що спричинило суперечки через статтю про крах глобальних акцій зберігання

robot
Генерація анотацій у процесі

Чи може технічне пояснення AI · TurboQuant заспокоїти академічні суперечки?

1 квітня, після майже тижневої мовчанки, команда Google, яка викликала суперечки навколо алгоритму стиснення TurboQuant, нарешті дала відповідь. Однак ця остання «технічна ясність» здається, що й досі не зняла суперечок: щодо звинувачень у «схожості основних технологій», Google стверджує, що випадкове обертання — це стандартна техніка, і вважає, що помилки в експериментальних базах даних «не мають значення для фактів».

У останній тиждень березня ця стаття, широко прославлена офіційним блогом Google, однією самою рукою зруйнувала світові ринки пам’яті для зберігання даних, зокрема, Micron, SK Hynix, Samsung Electronics — капіталізація яких зменшилася більш ніж на 90 мільярдів доларів. У статті йшлося, що алгоритм стиснення TurboQuant здатен зменшити споживання пам’яті KV-кешу великих мовних моделей щонайменше у 6 разів, прискорити швидкість до 8 разів і при цьому зберегти точність без втрат.

Паніка на Уолл-стріт полягає в тому, що якщо програмне забезпечення може зменшити потребу у пам’яті AI у 6 разів, логіка зростання апаратного забезпечення для чіпів має бути переписана.

Однак, все швидко змінилося. 27 березня автор RaBitQ, аспірант з Федерального політехнічного університету Цюриха Гао Цзяньян, опублікував на платформі Zhihu довгий текст, звинувативши команду Google у системних академічних порушеннях, і громадськість швидко переключилася на питання про академічну недоброчесність Google.

Загалом у галузі вважається, що RaBitQ першою запропонувала оригінальний метод, TurboQuant його оптимізувала, але не надала належних посилань і поваги, а також зробила несправедливі приниження.

1 квітня, у відповідь на звинувачення з боку громадськості, другий автор статті, Маджид Далірі, нарешті виступив і на платформі OpenReview опублікував пояснення з чотирьох пунктів.

Щодо новизни основної технології, Google стверджує, що ключовий метод TurboQuant не походить від RaBitQ. Адже «випадкове обертання — це стандартна, всюдисуща техніка у літературі з кількісних методів», і ще до появи RaBitQ ця техніка широко використовувалася. Справжня інновація TurboQuant полягає у виведенні розподілу координат після обертання.

Проте правила академічної етики такі: якщо хтось першим застосував «колесо» до «автомобіля» і створив цілісну машину, то посилання і подяка від наступних — це базова академічна етика. Google знецінює досягнення попередників, зводячи їх до загальноприйнятих знань, що зменшує внесок першопрохідців.

По-друге, щодо звинувачень у знецінюванні RaBitQ як «субоптимального», автори статті визнають, що через недбалість у вивченні додатків, пропустили константний коефіцієнт і зробили поспішний висновок, «через що спочатку чесно описали цей метод як субоптимальний». Після ретельнішого аналізу вони дійшли висновку, що RaBitQ дійсно є оптимальним, і команда оновлює рукопис TurboQuant.

Однак, одна стаття для провідної конференції, яка базується на тому, що критика основних теорій колег ґрунтується на «недостатньому вивченні додатків», — така аргументація викликає сумніви.

У третій частині, щодо звинувачень у «запиранні опонента ігрового поля», Маджид Далірі прямо зазначив, що навіть якщо зовсім ігнорувати порівняння з RaBitQ у часі виконання, науковий вплив і ефективність статті залишаються майже незмінними. Адже головний внесок TurboQuant — у компромісі між якістю стиснення та швидкодією, а не у конкретному прискоренні.

Раніше Гао Цзяньян у відкритому листі повідомив, що команда Google тестувала RaBitQ на одному ядрі CPU з вимкненим багатопоточним режимом, тоді як тестування TurboQuant проводилося на GPU NVIDIA A100. Хоча команда стверджує, що швидкість не є головним фактором, у статті швидкість все ж була одним із ключових аргументів.

Насамкінець, у відповіді Google натякнули, що опоненти «мають свої інтереси», і зазначили, що стаття була опублікована на arXiv ще у квітні 2025 року, і що у опонентів був майже рік для подання питань через академічні канали, але вони почали активізуватися лише після широкого розголосу.

За словами Гао Цзяньяня, ще у травні 2025 року сторони вели приватну переписку, у листопаді того ж року зверталися до організаторів ICLR, але безуспішно. Лише коли Google офіційно підняла статтю на публічний рівень із мільйонним охопленням, академічна критика стала нагальною.

На платформі OpenReview дослідники прокоментували, що це — серйозна проблема, яка заслуговує більшої уваги: «Дивно, що люди, які займаються фундаментальними дослідженнями, залишаються непоміченими, тоді як великі та впливові організації активно просувають свої результати». Це більше схоже не на науку, а на PR-війну з великими компаніями.

Також, рецензенти статті TurboQuant висловили свою позицію, зазначивши, що через їхній аналіз і результати експериментів вони високо оцінили цю роботу.

«Я також чітко зазначив, що RaBitQ і TurboQuant використовують випадкове обертання, і закликав авторів TurboQuant порівняти, як дизайн TurboQuant і RaBitQ впливає на продуктивність». — сказав один із рецензентів. Він додав, що правильна академічна практика — глибоко обговорювати різницю між RaBitQ і TurboQuant у статті, але «на жаль, у основних експериментах RaBitQ згадувалася лише один раз».

Не можна заперечувати, що TurboQuant має комерційний потенціал. Один магістр штучного інтелекту у Zhihu проаналізував, що у сценаріях обчислення великих моделей об’єм пам’яті KV-кешу безпосередньо визначає кількість запитів, які може обробляти одна карта одночасно, що є ключовим економічним показником для сервісів. Збільшення паралельності у 6 разів означає, що вартість обчислень на один запит може знизитися до шостої частини. Це стане величезним зниженням витрат для компаній, що обробляють мільярди API-запитів щодня, і саме тому ця новина викликала коливання на фондовому ринку.

Ця стаття Google планує опублікувати на конференції ICLR 2026 наприкінці квітня, але команда має подолати цю академічну суперечку. Як вона завершиться — ще невідомо.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити