Une publication de Google qui fait chuter les actions mondiales de stockage suscite une controverse académique. Des chercheurs chinois affirment qu'elle est gravement erronée et qu'ils refusent de reconnaître leurs erreurs : elle utilise notre méthode mais évite délibérément la similarité.

MaticHoleFiller · 2026-03-30T16:53:12+00:00

Journaliste | Yue Chupeng Le 26 mars, une publication du Google Research a secoué le marché mondial des puces de stockage, entraînant la chute de plus de 90 milliards de dollars de la capitalisation boursière des géants américains et sud-coréens. La publication de Google affirme qu’un nouvel algorithme nommé TurboQuant peut compresser l’utilisation de mémoire du cache KV des grands modèles d’IA à 1/6 de l’original sans perte de précision. Seulement un jour plus tard, Gao Jianyang, post-doctorant à l’École polytechnique fédérale de Zurich, a publié sur une plateforme sociale en dénonçant de graves problèmes académiques dans la publication de Google. Gao Jianyang a souligné que Google a évité de mentionner la similarité entre l’algorithme TurboQuant et la méthode RaBitQ qu’il a publiée lors de ses études doctorales à l’Université technologique de Nanyang (NTU) à Singapour en 2024, et a mal décrit les résultats théoriques de RaBitQ, en plus de

MaticHoleFiller

2026-03-30 16:53:12

记者|岳楚鹏

Le 26 mars, un article de Google Research a secoué le marché mondial des puces de stockage, entraînant l’évaporation de plus de 90 milliards de dollars de la capitalisation boursière de grands groupes américains et sud-coréens.

L’article de Google affirme que de nouveaux algorithmes, appelés TurboQuant, peuvent compresser l’occupation mémoire des caches KV de grands modèles d’IA jusqu’à 1/6 de l’original, sans perdre en précision.

À peine un jour plus tard, le post-doctorant de l’EPF de Zurich, Gao Jianyang, a publié un message sur une plateforme sociale, pointant du doigt de graves problèmes académiques dans l’article de Google.

Gao Jianyang a indiqué que Google évitait la similarité entre l’algorithme TurboQuant et la méthode RaBitQ qu’il avait publiée pendant son doctorat à l’université Nanyang Technological University (NTU) à Singapour en 2024, et qu’il décrivait de manière erronée les résultats théoriques de RaBitQ, tout en mettant délibérément en place un environnement expérimental injuste.

RaBitQ est un algorithme de quantification vectorielle, capable de garantir la fiabilité de la recherche tout en conservant des données vectorielles dans un état de compression très élevée.

Gao Jianyang a également déclaré que l’équipe TurboQuant de Google « reconnaît ses erreurs sans les corriger ». Avant même la publication officielle de l’article Google en avril 2025, il avait déjà signalé par e-mail les problèmes susmentionnés, mais, une fois informé, Google n’a pas procédé à une correction complète dans la version finale.

Le 29 mars, le journaliste du « Quotidien économique » (ci-après NBD) a interviewé les auteurs de l’article RaBitQ, Gao Jianyang et Long Cheng.

RaBitQ est le principal travail de Gao Jianyang pendant son doctorat à l’université Nanyang Technological University à Singapour ; Long Cheng est son directeur de thèse.

Parallèlement, le journaliste du « Quotidien économique » a également envoyé des e-mails d’interview à Google, mais au moment de la rédaction, aucune réponse n’avait été reçue. D’après les informations, Google Research présentera son article TurboQuant à la conférence internationale sur la représentation des apprentissages de 2026 (ICLR 2026) prévue en avril.

Gao Jianyang Image source : fourni par la personne interviewée

NBD : À quel moment avez-vous d’abord remarqué que l’article TurboQuant de Google posait problème ?

Gao Jianyang : Dès janvier 2025, le deuxième auteur de l’article TurboQuant, Majid Daliri, nous a contactés de lui-même en demandant de l’aide pour déboguer sa version Python traduite à partir du code C++ de RaBitQ, et en décrivant les étapes de reproduction détaillées ainsi que les informations d’erreur. Cela montre que l’équipe TurboQuant connaissait suffisamment les détails techniques de RaBitQ.

Après la publication de l’article TurboQuant en avril 2025, nous avons constaté que la description de RaBitQ dans cet article était gravement inexacte : l’article décrit RaBitQ comme une grid-based PQ (multiplication quantification fondée sur une grille), ignorant totalement son étape centrale de rotation aléatoire, et qualifie la garantie théorique de RaBitQ de « sous-optimale », sans aucune déduction ni preuve ; les comparaisons expérimentales présentent également une conception clairement injuste.

Notre première réaction a été la confusion et la déception : la similarité entre TurboQuant et RaBitQ est techniquement clairement identifiable, et l’autre partie en sait bien plus que l’image typique d’un lecteur ordinaire. Dans ce contexte, il est difficile d’expliquer une description aussi systématiquement inexacte par simple négligence.

NBD : Avant de rendre les choses publiques, quelles communications les deux équipes ont-elles eues ?

Gao Jianyang : Nous avons mené plusieurs séries d’échanges, sur une période de plus d’un an.

En mai 2025, nous avons eu une discussion technique détaillée par e-mail avec Majid Daliri au sujet des différences de conditions expérimentales et de l’optimalité des résultats théoriques, en clarifiant point par point les interprétations erronées de l’équipe TurboQuant ; Majid Daliri a clairement indiqué qu’il avait communiqué les résultats de ces discussions à tous les co-auteurs.

Cependant, après que nous lui avons demandé de corriger les erreurs factuelles dans l’article, il a cessé de répondre.

En novembre 2025, nous avons découvert que TurboQuant avait été soumis à ICLR 2026 (conférence internationale sur la représentation des apprentissages de 2026), et que le contenu erroné était resté inchangé. Nous avons alors contacté les ICLR 2026 PC Chairs (présidents du comité) mais sans obtenir de réponse.

Après qu’en mars 2026, l’article ait fait l’objet d’une large promotion via les canaux officiels de Google, nous avons de nouveau envoyé un e-mail formel à tous les auteurs.

La réponse reçue était la suivante : le premier auteur Amir Zandieh s’est engagé à corriger la description théorique et les conditions expérimentales, mais a explicitement refusé de corriger la discussion sur la similarité méthodologique, et a déclaré qu’il ne ferait les modifications qu’après la fin officielle de la conférence ICLR 2026. Cette réponse nous a déçus, mais pas vraiment de manière inattendue. L’autre partie savait manifestement où se situait le problème, mais a choisi de faire le minimum de concessions.

NBD : Quelles sont les similarités les plus cruciales entre TurboQuant et RaBitQ ?

Gao Jianyang : La similarité la plus essentielle réside dans le fait que les deux utilisent, avant la quantification, une rotation aléatoire appliquée aux vecteurs (transformation de Johnson-Lindenstrauss), et exploitent les propriétés statistiques de la distribution des coordonnées après la rotation pour construire un estimateur de distance.

Il est à noter que, dans les réponses aux reviewers publiées sur ICLR OpenReview (plateforme de révision publique couramment utilisée dans le milieu académique), les auteurs de l’article TurboQuant décrivent ainsi leur méthode : « Notre implémentation consiste d’abord à normaliser à l’aide de la norme L2 du vecteur, puis à appliquer une fois une rotation aléatoire, afin de garantir que les différentes composantes de ces vecteurs après rotation suivent une distribution Beta. » Cela correspond fortement au mécanisme central de RaBitQ, mais cette connexion n’est jamais expliquée frontalement dans le corps principal de l’article.

On peut comprendre cela avec une analogie : supposons qu’un cuisinier publie d’abord un livre de recettes complet d’un plat. Ensuite, un autre cuisinier publie un plat qui utilise presque les mêmes étapes centrales, mais, dans sa description, il présente le premier comme « une autre recette dont la méthode diffère et dont les effets sont moins bons », sans mentionner le moindre lien entre les deux.

Sans le savoir, les lecteurs ne peuvent naturellement pas porter un jugement équitable.

Long Cheng Image source : fourni par la personne interviewée

NBD : Selon les normes académiques, comment ce type de relation devrait-il être traité ?

Long Cheng : Les normes académiques exigent que, lorsqu’une nouvelle contribution présente une connexion substantielle sur le plan méthodologique avec des travaux existants, il faille l’indiquer clairement et discuter positivement cette connexion, en précisant dans quels aspects le nouveau travail a progressé et quels aspects il reprend à partir du cadre existant.

Dans ce cas, cela est particulièrement important, car un reviewer d’ICLR a également, de manière indépendante, souligné dans ses commentaires que « RaBitQ et ses variantes sont similaires à TurboQuant en ce qu’ils utilisent tous des projections aléatoires », et a explicitement exigé une discussion et une comparaison plus approfondies.

Même le reviewer a remarqué cette connexion, mais les auteurs de l’article, dans la version finale, n’ont non seulement ajouté aucune discussion, mais ont plutôt déplacé la description initialement incomplète de RaBitQ figurant dans le corps du texte vers l’annexe. Cette manière de faire va à l’encontre des exigences fondamentales des normes académiques.

NBD : Pourquoi avoir choisi de rendre cela public maintenant plutôt que de continuer à résoudre la question en interne par les canaux académiques ?

Long Cheng : Nous n’avons pas contourné les canaux académiques ; nous avons choisi de rendre public, alors même que les canaux académiques avaient pratiquement été épuisés.

Nous avons d’abord contacté les auteurs de l’article, les ICLR PC Chairs (présidents du comité de programme), et avons également déposé une plainte officielle assortie d’un dossier de preuves complet auprès des ICLR General Chairs (présidents de la conférence) et des Code and Ethics Chairs (présidents du code et de l’éthique). Par ailleurs, nous avons aussi publié des commentaires publics sur la plateforme ICLR OpenReview.

Mais nous devons aussi reconnaître une réalité : nous sommes une petite équipe de recherche universitaire ; en face, il s’agit de Google Research. Sur les plans des ressources, de l’influence et du pouvoir de parole, les deux parties ne sont pas du tout sur un pied d’égalité.

En l’espace d’un court moment, l’article TurboQuant a atteint des dizaines de millions de vues pertinentes sur les réseaux sociaux, une capacité de diffusion qu’aucun laboratoire universitaire ne pourrait avoir.

Dans une telle asymétrie, si nous continuons à garder le silence en attendant que les procédures internes suivent leur cours, un récit erroné ne ferait qu’accélérer la cristallisation en consensus. Rendre les choses publiques est l’une des rares options dont la partie la plus faible dispose lorsque la réponse via les canaux formels est lente, afin de défendre des faits académiques de base.

NBD : Si ces problèmes liés ne sont pas corrigés, quelles conséquences possibles ?

Long Cheng : D’abord, cela faussera systématiquement les archives de l’histoire académique, amenant les chercheurs ultérieurs à mal juger l’origine de l’évolution méthodologique, puis à construire de nouveaux travaux sur des bases erronées.

Deuxièmement, cela sapera le mécanisme d’incitation à la recherche originale. Si une méthode assortie d’une déduction théorique rigoureuse et atteignant des bornes d’erreur asymptotiquement optimales peut être reconditionnée et propulsée vers le public avec une exposition de plusieurs dizaines de millions, tandis que les auteurs originaux n’obtiennent pas la reconnaissance qui leur revient, les dommages à l’écosystème académique seront durables et profonds.

三ièmement, dans le domaine de la quantification vectorielle, qui est en train de connaître un développement rapide et qui attire fortement l’attention de l’industrie, une attribution inexacte des méthodes influencera directement la manière dont les acteurs et les chercheurs jugent les lignes techniques, entraînant un mauvais déploiement des ressources.

NBD : Est-ce que vous pensez que cela relève d’un désaccord académique ?

Long Cheng : Cela dépasse la catégorie du simple désaccord académique. Les désaccords académiques surviennent généralement lorsque les deux parties ont une compréhension réelle différente du contenu technique.

Mais dans le présent cas, l’équipe TurboQuant dispose de preuves suffisantes documentant sa compréhension des détails techniques de RaBitQ. En mai 2025, nous avons déjà clarifié par e-mail, point par point, l’optimalité des garanties théoriques ; Majid Daliri a clairement déclaré qu’il l’avait communiqué à tous les auteurs ; l’asymétrie des conditions expérimentales a également été reconnue par l’auteur lui-même dans les e-mails.

Dans les circonstances ci-dessus, les erreurs concernées n’ont jamais été corrigées tout au long du processus, de la soumission de l’article, au reviewing, à l’acceptation, à la publication et à la grande promotion. Nous ne sommes pas enclins à porter un jugement à la légère, mais nous pensons qu’une série d’actions a fourni suffisamment de bases factuelles permettant à la communauté académique et aux institutions concernées de juger de manière indépendante.

Image source : compte de médias sociaux de Gao Jianyang

NBD : Pour des organisations de recherche de grande taille comme Google Research Institute, quelles sont leurs responsabilités ?

Long Cheng : Le soutien des grandes institutions lui-même produit un effet multiplicateur. Lorsqu’un article est promu via les canaux officiels de Google, sa vitesse de diffusion et sa portée ne peuvent pas être comparées à celles d’un article académique ordinaire.

À une telle échelle, une fois que le récit erroné dans l’article se propage, le coût de sa correction augmente de manière exponentielle. Je pense que les grandes institutions ont la responsabilité, avant de faire une large promotion externe de l’article, de s’assurer que les descriptions impliquant le travail d’autrui ont fait l’objet d’une vérification factuelle de base, plutôt que de transférer entièrement cette responsabilité aux reviewers.

En même temps, lorsque des chercheurs externes soulèvent des objections étayées, les grandes institutions devraient également disposer de mécanismes internes formels pour traiter ces objections, au lieu de rester silencieuses. Cela constitue à la fois une responsabilité envers la communauté académique et une protection de leur propre crédibilité.

NBD : Allez-vous prendre des mesures supplémentaires ensuite ?

Long Cheng : Ensuite, nous prévoyons de publier un rapport technique détaillé sur arXiv, qui mettra systématiquement en évidence la relation méthodologique entre RaBitQ et TurboQuant, et d’exposer, point par point, trois questions sur le plan technique, afin que la communauté académique puisse s’y référer.

Nous envisageons également de remonter l’information vers des institutions concernées via des canaux supplémentaires, telles que le Google Research Escalation Council. Notre objectif est de toujours faire en sorte que les archives académiques publiques reflètent avec exactitude les relations réelles entre les différentes méthodes, et non de créer de l’opposition.

Des informations massives, une interprétation précise : le tout sur l’application Sina Finance

Responsable éditorial : Chang Fuqiang

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.