Google Сжимает память ИИ без потери точности — но есть подвох
Кратко
Google заявила, что её алгоритм TurboQuant может сократить основное узкое место памяти ИИ минимум в шесть раз без потери точности во время инференса.
Акции производителей памяти, включая Micron, Western Digital и Seagate, упали после распространения работы.
Метод сжимает память инференса, а не саму модель
Decrypt·03-25 23:30


