Google розробила «аналог Pied Piper» для восьмикратного прискорення обчислень у нейросетях - ForkLog: криптовалюти, ІІ, сингулярність, майбутнє

robot
Генерація анотацій у процесі

Google 2025# Google розробила «аналог Pied Piper» для восьмикратного прискорення обчислень у нейросетях

Дослідницьке підрозділ Google представило TurboQuant — алгоритм стиснення пам’яті для штучного інтелекту. Користувачі порівняли розробку з технологією стартапу Pied Piper із серіалу «Кремнієва долина».

TurboQuant — новий Pied Piper 🤣 pic.twitter.com/iMAYJs02zt

— Justin Trimble (@justintrimble) 25 березня 2026

TurboQuant значно знижує вимоги до ресурсів для роботи великих мовних моделей і систем векторного пошуку

Штучний інтелект оперує складними багатовимірними масивами, що зберігають інформацію про слова або зображення. Ці дані займають багато місця в кеші та сповільнюють генерацію відповідей. Традиційні методи стиснення вимагають збереження додаткових змінних, що часто зводить нанівець користь від оптимізації.

TurboQuant вирішує проблему перевитрати пам’яті за допомогою двох механізмів. Перший алгоритм переводить вектори у полярну систему координат і стискає основний обсяг даних. Другий працює як математичний контролер, використовуючи всього один біт пам’яті для усунення залишкових прихованих помилок.

Генеральний директор Cloudflare Метью Прінс порівняв алгоритм із досягненнями китайської моделі DeepSeek, яка раніше демонструвала високу ефективність при мінімальних витратах на обладнання.

Це DeepSeek від Google. Ще багато можливостей для оптимізації штучного інтелекту щодо швидкості, використання пам’яті, енергоспоживання та багатоплатформеного використання. Багато команд у @Cloudflare зосереджені на цих напрямках. #залишайтесяназв’язку https://t.co/hHoY4sLT2I

— Matthew Prince 🌥 (@eastdakota) 25 березня 2026

Розробники протестували технологію на відкритих моделях Llama, Gemma і Mistral. Алгоритм стиснув кеш до трьох біт без втрати якості відповідей. Споживання пам’яті зменшилося щонайменше у шість разів, а швидкість обчислень на графічних прискорювачах H100 зросла вісім разів.

Інновація не потребує додаткового навчання нейромереж. За словами корпорації, технологію впровадять у пошукові алгоритми та власні ІІ-продукти, зокрема Gemini. Публічна презентація проекту відбудеться на профільних конференціях ICLR і AISTATS у 2026 році.

Нагадаємо, 25 березня Google розкрила свої плани щодо переходу на постквантову криптографію.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити