IplanRIO a présenté le modèle d'IA ouvert Rio 3.5 - ForkLog

network abstraction (single interface for all blockchains) cryptocurrency network абстракция сети (единый интерфейс для всех блокчейнов) криптовалюты сеть# IplanRIO a présenté le modèle d'IA ouvert Rio 3.5

La société municipale de technologie de Rio de Janeiro, IplanRIO, a présenté Rio 3.5 Open 397B comme un modèle d'IA ouvert, entraîné avec des fonds publics, surpassant DeepSeek V4 Pro et Qwen 3.7 Plus selon plusieurs benchmarks. Cependant, un jour plus tard, l'équipe de développement IA Nex a déclaré que l'outil ressemblait à une fusion directe de Nex-N2-Pro et Qwen3.5-397B-A17B.

Après ces accusations, IplanRIO a mis à jour la fiche de Rio 3.5 Open 397B sur Hugging Face. La nouvelle description indique que le modèle a été construit par fusion de Nex-N2-Pro et Qwen3.5-397B-A17B, suivie d'une distillation à partir d'un modèle plus puissant.

Comment Rio 3.5 a été présenté

IplanRIO a publié Rio 3.5 Open 397B sur Hugging Face le 13 juin 2026 sous licence MIT. Dans la description initiale, le projet était présenté comme un système d'IA généraliste « de niveau avancé » et il était indiqué que le modèle avait été affiné à partir de Qwen3.5-397B-A17B.

Les caractéristiques mentionnaient 397 milliards de paramètres, dont 17 milliards sont activés lors du traitement de chaque token. Cette architecture est appelée Mixture-of-Experts (MoE) : le modèle n’utilise pas tous ses paramètres simultanément, mais seulement une partie de blocs spécialisés.

IplanRIO indiquait également une fenêtre contextuelle de 1,01 million de tokens et l’utilisation de SwiReasoning. Dans la description du projet, ce cadre est présenté comme un mécanisme qui permet au modèle de basculer entre des modes de raisonnement explicite et implicite.

La première version de la fiche du projet présentait des résultats de tests où Rio 3.5 surpassait Qwen 3.7 Plus et DeepSeek V4 Pro. Sur Terminal-Bench 2.1, le modèle a obtenu 70,8 %, contre 70,3 % pour Qwen 3.7 Plus et 67,9 % pour DeepSeek V4 Pro. Lors de Humanity’s Last Exam, le score était de 36,5 % contre 34,7 % pour Qwen 3.7 Plus, et sur IMOAnswerBench — 89,5 %.

Source : DecryptAprès la sortie, le maire de Rio de Janeiro, Eduardo Cavalieri, a écrit sur X que le modèle d'IA ouvert, entraîné à Rio avec des fonds publics, « a surpassé tous les autres modèles ».

🇧🇷 Modèle d'IA ouvert entraîné à Rio avec financement public au cours de la dernière année par @Prefeitura_Rio surpassant tous les autres modèles. L'intelligence artificielle n'est pas une chose distante, étrangère, de laboratoire milliardaire… elle ne sert pas seulement à faire du texte, des images… https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) 14 juin 2026

Ce que Nex a déclaré

Le 14 juin, Nex a publié une déclaration dans le dépôt Nex-N2 sur GitHub. La société a affirmé que Rio 3.5 Open 397B était présenté comme un modèle original d’IplanRIO, mais que ses poids ressemblent à une fusion élément par élément de Nex-N2-Pro et Qwen3.5-397B-A17B.

Selon Nex, Rio 3.5 est composé à environ 60 % de Nex-N2-Pro et à 40 % de Qwen3.5-397B-A17B. La société affirme n’avoir trouvé aucune preuve d’un apprentissage autonome d’IplanRIO.

Nex a avancé deux arguments. Après avoir supprimé le prompt système « You are Rio », le modèle, selon la société, se nommait « Nex, from Nex-AGI » dans 79 % des réponses et ne se nommait jamais Rio. De plus, Nex a indiqué que chaque tenseur de poids de Rio reproduit la proportion 0,6/0,4 entre Nex et Qwen dans les 60 couches du modèle.

« Il n’y a pas d’explication innocente à cela », — déclare Nex.

Dans un post séparé, la société a formulé une accusation plus simple : Rio 3.5 est essentiellement un modèle open-source Nex N2 Pro « dans une autre enveloppe ».

Le modèle Rio 3.5 a fait exploser Internet cette semaine. Le rebondissement ? C’est essentiellement notre modèle open-source, Nex N2 Pro, portant un chapeau différent.

🤯 Nous avons analysé les poids, et la recette est exacte : Rio 3.5 ≈ 0,6 * Nex N2 Pro + 0,4 * Qwen 3.5

Il se présente même littéralement comme lui… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 14 juin 2026

Pourquoi les benchmarks ont suscité des questions

Decrypt a noté que Nex-N2-Pro affiche dans ses propres tests des résultats supérieurs à ceux de Rio 3.5 dans la fiche initiale. Sur Hugging Face, la description de Nex-N2-Pro indique 75,3 % sur Terminal-Bench 2.1 contre 70,8 % pour Rio 3.5. Sur GDPval, Nex a obtenu 1585 points contre 1533 pour Rio.

Comme l’a souligné la publication, si Rio est effectivement un mélange de Nex-N2-Pro et Qwen3.5-397B-A17B, ses résultats plus faibles par rapport à Nex sont attendus. De plus, les benchmarks de Rio 3.5 ont été retirés de la description principale après la mise à jour de la fiche.

La réponse d’IplanRIO

Après ces accusations, IplanRIO a modifié le README du modèle sur Hugging Face. La version actuelle indique que Rio 3.5 Open 397B a été construite par fusion de Nex-N2-Pro et Qwen3.5-397B-A17B, puis a été distillée.

La distillation est une méthode d’apprentissage où une modèle plus puissant transfère son comportement à un modèle plus faible. Dans ce cas, IplanRIO affirme qu’elle aurait dû publier non pas la version de base, mais le modèle final distillé.

« Nous regrettons la confusion et présentons nos excuses », — indique le README mis à jour.

L’équipe a également annoncé qu’elle travaille à recharger la version correcte du modèle. Aucun commentaire public détaillé d’IplanRIO, en dehors du README mis à jour, n’a été publié au moment de la rédaction.

En quoi consiste le différend

L’utilisation de modèles open-source n’est pas en soi une violation. Nex-N2-Pro est publié sous licence Apache 2.0, et Qwen3.5-397B-A17B est également disponible en tant que modèle open-source. Ces licences permettent d’utiliser, de modifier et de distribuer les modèles sous réserve de respecter les conditions.

Le conflit a émergé autour de la présentation de Rio 3.5. La fiche initiale donnait l’impression d’un développement autonome et d’un affinement basé sur Qwen3.5-397B-A17B, sans mentionner Nex-N2-Pro comme source. Dans la communauté open-source, cela est perçu comme un problème de transparence. La fusion de poids open-source, l’affinement et la distillation sont des pratiques courantes, mais les développeurs attendent la divulgation des modèles sources et de la contribution de tiers.

Auparavant, Alibaba avait présenté la famille de modèles hybrides Qwen3, capables de « rivaliser ou surpasser dans certains cas » les meilleures solutions de Google et OpenAI.

Rappelons que le startup chinois d’IA DeepSeek a présenté DeepSeek-R1 en janvier 2025. Ce modèle a été l’un des événements majeurs du marché de l’IA à cette époque.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé