Google Reduz a Memória de IA Sem Perda de Precisão—Mas Há um Pormenor
Em breve
Google disse que seu algoritmo TurboQuant pode reduzir um grande gargalo de memória da IA em pelo menos seis vezes sem perda de precisão durante a inferência.
As ações de memória, incluindo Micron, Western Digital e Seagate caíram após a circulação do artigo.
O método comprime memória de inferência, não o modelo
Decrypt·03-25 23:30


