O artigo do TurboQuant da Google criticado pelo autor do algoritmo anterior

De acordo com 1M AI News, Gao Jianyang, um investigador pós-doutorado no ETH Zurich, publicou uma carta aberta acusando o artigo TurboQuant da ICLR 2026 do Google de três graves imprecisões na descrição do seu trabalho anterior, RaBitQ. Gao Jianyang, o autor principal de RaBitQ, um algoritmo publicado em 2024 na principal conferência de bases de dados SIGMOD, utiliza rotação aleatória (transformação Johnson-Lindenstrauss) antes da quantização. Este método foi rigorosamente provado para atingir limites de erro assintoticamente ótimos e foi convidado para apresentação em um workshop da principal conferência de ciência da computação teórica, FOCS.

As três acusações são:

  1. Evasão de Similaridade Metodológica: O método central do TurboQuant também utiliza rotação aleatória. No entanto, o artigo categoriza RaBitQ como ‘PQ baseado em grelha’, omitindo sistematicamente a conexão metodológica direta entre os dois. Os revisores da ICLR apontaram independentemente que ambos os métodos utilizam projeção aleatória e solicitaram uma discussão suplementar. A equipe do TurboQuant não só falhou em fornecer isso, como também moveu a descrição de RaBitQ do texto principal para o apêndice.
  2. Resultados Teóricos Inaccurados: O artigo rotula qualitativamente a garantia teórica de RaBitQ como ‘subótima’ sem qualquer justificação, atribuindo-a a uma ‘análise frouxa.’ Um artigo extenso sobre RaBitQ já provou que seu limite de erro atinge o limite assintoticamente ótimo dado por Alon-Klartag (FOCS 2017).
  3. Comparação Experimental Injusta: O TurboQuant testou RaBitQ utilizando um código Python auto-traduzido em uma CPU de núcleo único (com multi-threading desativado), enquanto testava seu próprio algoritmo em uma GPU NVIDIA A100. Isso resultou em RaBitQ sendo reportado como ordens de magnitude mais lento. Esta configuração experimental não foi divulgada no artigo.

Gao Jianyang revelou que Majid Daliri, o segundo autor do TurboQuant, contatou proativamente a equipe do RaBitQ em janeiro de 2025 para solicitar assistência na depuração da sua versão em Python, que foi traduzida do código C++ do RaBitQ. Em um e-mail datado de maio de 2025, Daliri confirmou pessoalmente a configuração experimental injusta e declarou que as clarificações teóricas da equipe do RaBitQ tinham sido comunicadas a todos os co-autores. Apesar disso, os problemas permaneceram não corrigidos durante todo o processo de submissão, revisão, aceitação e promoção extensiva do TurboQuant pelo Google.

A equipe do RaBitQ publicou um comentário público no ICLR OpenReview e submeteu uma queixa formal ao Presidente da Conferência ICLR e ao Comitê de Ética.

Amir Zandieh, o autor principal do TurboQuant, respondeu, expressando vontade de corrigir os segundo e terceiro problemas, mas recusando-se a suplementar a discussão sobre similaridade metodológica. Ele apenas concordou em fazer correções após a conclusão da conferência ICLR 2026. O investigador de terceiros Jonas Matthias Kübler também notou independentemente no OpenReview inconsistências entre o artigo e o blog do Google em relação a benchmarks de velocidade (PyTorch vs. JAX) e a linha de base de quantização (FP32).

Após uma extensa promoção oficial pelo Google, a liberação anterior do TurboQuant já havia causado uma queda coletiva nas ações de chips de armazenamento, incluindo as da Micron e da Western Digital.

ETH0,77%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar