Виробник пам’яті різко обвалився на понад мільярд, чи був це просто помилковий сигнал?

Трейдинг акціями — дивіться аналітичні матеріали від аналітиків “Jin Qilin”: авторитетно, професійно, своєчасно, всеосяжно — допоможемо вам розкрити потенційні теми й можливості!

(Джерело: NetEase Technology)

Якби Google не влаштував оцю виставу з TurboQuant, я б і не помітив, що ми стільки часу терпимо AI.

Цього місяця 24-го числа Google Research раптом опублікував пост і докладно розповів про алгоритм під назвою TurboQuant — алгоритм надмірного стискання.

Цей пост дуже просто пояснює, для чого потрібен TurboQuant: він може стискати пам’ять KV cache під час виведення (inference) великої моделі до 3.5 bit (приблизно в 6 разів), і при цьому майже не втрачає точності.

Якщо перекласти “на людську”, то Google Research представив алгоритм, який істотно зменшує споживання пам’яті великими моделями: раніше те, що можна було зробити лише з 600G пам’яті, тепер після використання цього алгоритму вистачає 100G!

Наступного ж дня кілька великих компаній зі зберігання даних, які тоді ще їли шашлики й співали, побачили, як їхні акції різко пішли вниз.

Акції Micron Technology впали на 3.4%, втрата ринкової капіталізації — 15.17B доларів, SanDisk (闪迪) спочатку впав на 6.5%, а до закриття падіння звузилося до 3.5%, втрата ринкової капіталізації — 3.63B доларів. Western Digital впав на 1.63%, втрата ринкової капіталізації — 1.66B доларів.

Джерело графіків: Sina Finance

Уся AI-спільнота вибухнула: всі почали аналізувати, у чому саме TurboQuant такий крутий, і як саме він впливає

Навіть CEO Claudflare опублікував допис із оцінкою: це “момент DeepSeek” від Google.

Багато друзів, побачивши цю новину, можливо, вже сміються в ковдрі до сліз: зроблено гарно! То що далі — пам’ять, твердотільні накопичувачі теж підуть услід і впадуть? Невже ми, хто збирає ПК сам, нарешті дочекалися виходу?

Я, звісно, теж сподіваюся, що все піде саме в цьому напрямі.

Щоб з’ясувати, чи може здійснитися оце найпростішe моє бажання, я спеціально трохи підготувався: вивчив, що ж таке TurboQuant насправді.

Результат: ще не встиг я розібратися, як цей TurboQuant “турбо-що”, як сталася різка інверсія на 180° ——

Ввечері 27 березня, о 22:00, постдок-дослідник ETH Цюріх (ETH Zurich) Гао Цзяньянь (高健扬) синхронно опублікував пости на Zhihu, X та платформі оцінювання ICLR, звинувативши, що наукова стаття, яку Google використовував для презентації алгоритму TurboQuant, містить серйозні порушення академічної доброчесності.

Гао Цзяньянь виявив, що TurboQuant від Google сильно збігається з алгоритмом RaBitQ, який робила його власна команда: на нижньому рівні теж використовується комбінація “random rotation + JL transformation”.

Якщо вже й “герої подібні, як бачать одне й те саме”, то що з цього… Але ж абсурд полягав у тому, що Гао Цзяньянь витягнув листи-підтвердження: ще в січні 2025 року другий автор статті Majid спеціально надсилав листа, тихенько й покірно звертаючись до Гао по допомогу — як запустити код RaBitQ.

Тобто виходить, що Google начебто повністю розібрався в деталях чужої роботи, а коли настав час підбивати підсумки, то взагалі не згадав, що саме зробили інші?

Нехай навіть “не показали джерело” — мало того, команда Turbo Quant навіть проігнорувала встановлені математичні докази й прямо в статті без жодних підстав жорстко “піддалася” теоріям Гао.

Гао Цзяньянь вважає, що його алгоритм RaBitQ уже строго доведено і досяг рівня першокласних стандартів “топ” конференцій у теоретичній інформатиці.

Але команда TurboQuant навіть не дивилася на виведення: без жодних доказів прямо в основному тексті навісила Гао ярлик “теоретично субоптимальний, аналіз грубий”.

Та найнестерпніше — це “магічний” двозначний підхід Google до бенчмаркінгу.

У статті вони вихваляються, що їхній алгоритм швидший за RaBitQ на кілька порядків, але за лаштунками були вкрай неприємні маніпуляції:

Google дає собі “монстра обчислювальної потужності” — GPU A100, а опонентам підбирає CPU із вимкненими багатопоточністю.

Крім того, вони не використовують готовий, високо оптимізований відкритий C++ код опонентів, а натомість беруть Python-версію, напівперекладену другим автором TurboQuant, і запускають її — ще й додаючи алгоритму Гао додатковий debuff.

У листуванні від травня минулого року другий автор цієї статті власноруч визнав цю асиметричну операцію “single-core б’є multiple-core”, а також визнав, що вони синхронізували цю справу з іншими співавторами статті.

Але у фінально опублікованій статті обидві ці “м’які й тверді” інформації, які можуть спричинити різницю рівня “від кількості до якості”, були повністю прибрані.

Одночасно автори TurboQuant відмовилися визнавати, що їхній алгоритм структурно схожий із RabitQ від Гао.

Цю статтю з грубими помилками, яку ICLR 2026 прийняла до публікації, згодом — через те, що починалося з історії на початку цього матеріалу — Google Research масштабно просував її через офіційні канали.

Google Research згадав лише те, наскільки TurboQuant “крутий”, скільки пам’яті можна зекономити, але жодного слова не сказав про численні помилки самої цієї статті, яка й підтримує TurboQuant.

Цей промо-рух, на платформі соцмереж перегляди вже сягнули десятків мільйонів разів, і тоді декілька топових виробників зберігання даних на минулому тижні влаштували в своїх біржових ринках справжні коливання.

Гао Цзяньянь, мабуть, теж не витримав і вирішив публічно виставити це на світло.

Водночас ринок зберігання даних з того часу поступово оговтався від першої хвилі турбулентності.

У той самий день, коли Amir Zandieh відповів на лист Гао, Micron Technology (MU) закінчила день із ростом на 0.5%, обсяг угод — 16.25B доларів, але за цей тиждень загалом все ще впала на 15.5%.

Я не знаю, які відчуття у друзів-читачів після цієї історії.

Мені здається, я як той “звірок” із городу, який реагує повільно: дивлюся, як товариші вже з’їли цей “плід”, і ті вже збираються переходити до наступного, а я турбуюся, що не хочу випасти з темпу.

А потім обернувся — а “звірки” вже почали стріляти: — Це “груша”, отруйна.

Ще більше бентежить інше: статтю з очевидними помилками та суперечками випустили на промо лише через рік. Та аж поки Гао Цзяньянь не вийшов і не “вбив” Google своїми доказами, здається, ми теж не чули, щоб хтось піднявся й публічно ставив під сумнів.

Ринок мовчить, лише трясе; так званий “AI-кіл” — це лише гуляння: нарешті хтось зміг упоратися з проблемою, коли AI-моделі шалено пожирають пам’ять.

Серед небагатьох, хто все ще зберіг здоровий глузд, і серед вітчизняних ЗМІ, що працюють як самостійні медіа, вони просто вказали, що ця історія повністю відповідає “парадоксу Джевонса” від давньої “старої добрих часів” Уолл-стріт:

TurboQuant дійсно знизив витрати на виведення довгих текстів, але як тільки поріг стає низьким, виробники безумовно розв’яжуть руки й почнуть активно розробляти ——

Зараз у вітчизняних моделей основний стандарт контекстного вікна — 200K-256K, лише деякі можуть дотягнути до 1M.

Але закордонні топові моделі вже вміють робити 1M. То скажете: якщо з’явиться цей алгоритм, чи не захочуть закордонні моделі розширити перевагу, а вітчизняні — з усіх сил наздоганяти?

Тоді різні мульти-модальні застосунки й довгі контексти масово підуть у продакшн: через те, що це “краще працює”, людей і сценаріїв стане в рази більше. У результаті глобально потрібні обчислювальні потужності та обладнання для зберігання не те що не заощадяться — їх просто “вибухом” доб’є величезний попит.

Але голосів, які сумнівалися б у тому, чи TurboQuant насправді такий неймовірний, наче не було почутно. Виходить, що значна частина людей без перевірки, без вивчення реального стану справ у наукових колах, просто прийняла, що TurboQuant від Google справді змінює світ.

Звісно, я так кажу не для того, щоб когось критикувати: коли я вперше побачив репортаж про TurboQuant, я теж радів, як дитина.

Я хочу наголосити ось на чому: ця вистава TurboQuant від Google викрила, що всі надто нетерплячі до AI.

Щоб прогодувати цей “залізний монстр, що пожирає гроші” у вигляді AI-обладнання, ми вже витримали занадто багато.

Ще з кінця минулого року навіть телефони — майже у кожного вдома такий гаджет — зросли в ціні через підвищення цін на пам’ять.

Джерело графіків: “锌刻度” Лі Ціньлінь

Тоді змінилася сама природа питання — дорогий AI нарешті все ж змусить купувати всіх і одразу.

Іронічно, але досі ніхто не може чітко пояснити, яку саме виробничу користь AI реально дає, і яку саме зручність він приносить.

На початку цього року Anthropic опублікувала масштабне дослідження про вплив AI на ринок праці.

Дослідження показало, що наразі AI використовують лише окремі професії, а проникнення AI у їхню роботу ще не таке високе, як очікували.

Джерело графіків: Anthropic

І ось у чому проблема: це продукт із низьким реальним проникненням у галузі, який заробляє лише на невеликій кількості людей, і по факту він не такий уже й зручний — а його негативний вплив зараз оплачує все суспільство…

У такій ситуації, якби мені хтось дав повідомлення, що є якась штука, яка зменшує апетит AI і не змушує мене знову підвищувати ціну — тоді я б, безумовно, сподівався, що ця новина правдива.

Можливо, саме тому стаття з помилками та алгоритм, який не був вкладений у комерційне використання, змогли розгойдати таку велику бурю.

На жаль, проте все це в кінцевому підсумку виявилося лише “урльон”.

Автор: Ши Ань

Редактор: Ранній підйом & Міло

Дуже багато новин, точна аналітика — усе в додатку Sina Finance APP

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити