IplanRIO apresentou o modelo de IA aberto Rio 3.5 - ForkLog

network abstraction (single interface for all blockchains) cryptocurrency network абстракция сети (единый интерфейс для всех блокчейнов) криптовалюты сеть# A IplanRIO apresentou o modelo de IA aberto Rio 3.5

A empresa municipal de TI do Rio de Janeiro, IplanRIO, apresentou o Rio 3.5 Open 397B como um modelo de IA aberto, treinado com fundos públicos e que supera o DeepSeek V4 Pro e o Qwen 3.7 Plus em várias métricas de referência. No entanto, um dia depois, a equipe de desenvolvimento de IA Nex afirmou que a ferramenta parecia uma fusão direta do Nex-N2-Pro e do Qwen3.5-397B-A17B.

Após as reclamações, a IplanRIO atualizou a ficha do Rio 3.5 Open 397B no Hugging Face. Na nova descrição, é mencionado que o modelo foi construído através da fusão do Nex-N2-Pro e do Qwen3.5-397B-A17B, com posterior destilação de um modelo mais forte.

Como foi apresentado o Rio 3.5

A IplanRIO publicou o Rio 3.5 Open 397B no Hugging Face em 13 de junho de 2026, sob licença MIT. Na descrição inicial, o projeto era referido como um sistema de IA de uso geral “de nível avançado” e indicava que o modelo foi ajustado com base no Qwen3.5-397B-A17B.

Nas especificações, mencionava-se que o modelo tinha 397 bilhões de parâmetros, dos quais 17 bilhões eram ativados ao processar cada token. Essa arquitetura é conhecida como Mixture-of-Experts (MoE): o modelo não usa todos os parâmetros de uma só vez, mas apenas uma parte de blocos especializados.

A IplanRIO também afirmava que o modelo tinha uma janela de contexto de 1,01 milhão de tokens e utilizava SwiReasoning. Na descrição do projeto, esse framework é apresentado como um mecanismo que alterna o modelo entre modos explícitos e implícitos de raciocínio.

Na primeira versão da ficha do projeto, eram apresentados resultados de testes nos quais o Rio 3.5 superava o Qwen 3.7 Plus e o DeepSeek V4 Pro. No Terminal-Bench 2.1, o modelo obteve 70,8%, contra 70,3% do Qwen 3.7 Plus e 67,9% do DeepSeek V4 Pro. No Humanity’s Last Exam, o resultado foi de 36,5% contra 34,7% do Qwen 3.7 Plus, e no IMOAnswerBench, 89,5%.

Fonte: DecryptApós o lançamento, o prefeito do Rio de Janeiro, Eduardo Cavaliere, escreveu no X que o modelo de IA aberto, treinado no Rio com fundos públicos, “superou todos os outros modelos”.

🇧🇷 Modelo de IA aberta treinada no Rio com financiamento público ao longo do último ano pela @Prefeitura_Rio superando todos os outros modelos. Inteligência artificial não é uma coisa distante, estrangeira, de laboratório bilionário…não existe só pra fazer texto, imagens… https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) 14 de junho de 2026

O que afirmou a Nex

Em 14 de junho, a Nex abriu uma reclamação no repositório Nex-N2 no GitHub. A empresa afirmou que o Rio 3.5 Open 397B foi apresentado como um modelo original da IplanRIO, mas seus pesos parecem uma fusão direta de Nex-N2-Pro e Qwen3.5-397B-A17B.

Segundo a Nex, o Rio 3.5 é composto aproximadamente por 60% de Nex-N2-Pro e 40% de Qwen3.5-397B-A17B. A empresa afirma não ter encontrado sinais de que a IplanRIO tenha feito um treinamento independente.

A Nex apresentou dois argumentos. Após remover o prompt de sistema “You are Rio”, o modelo, segundo a empresa, se autodenominava “Nex, from Nex-AGI” em 79% das respostas e nunca se chamou de Rio. Além disso, a Nex afirmou que cada tensor de peso do Rio reproduz a proporção de 0,6/0,4 entre Nex e Qwen em todas as 60 camadas do modelo.

“Não há uma explicação inocente para isso”, — afirma a Nex.

Em um post separado, a empresa resumiu a reclamação de forma mais simples: o Rio 3.5, na essência, é um modelo open-source da Nex N2 Pro “em uma embalagem diferente”.

The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.

🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5

It even literally introduces itself… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 14 de junho de 2026

Por que as métricas geraram dúvidas

A Decrypt observou que a Nex-N2-Pro, em seus próprios testes, apresenta resultados mais altos do que o Rio 3.5 na ficha inicial. Na descrição do Nex-N2-Pro no Hugging Face, indicava-se 75,3% no Terminal-Bench 2.1, contra 70,8% do Rio 3.5. No GDPval, o modelo Nex obteve 1585 pontos, contra 1533 do Rio.

Como destacou a publicação, se o Rio realmente for uma mistura de Nex-N2-Pro e Qwen3.5-397B-A17B, seus resultados mais fracos em relação ao Nex são esperados. Além disso, as próprias métricas do Rio 3.5 foram removidas da descrição principal após a atualização da ficha.

Como respondeu a IplanRIO

Após as reclamações, a IplanRIO alterou o README do modelo no Hugging Face. Na versão atual, é indicado que o Rio 3.5 Open 397B foi construído através da fusão do Nex-N2-Pro e do Qwen3.5-397B-A17B, seguido de destilação.

A destilação é um método de treinamento em que uma modelo aprende a imitar o comportamento de uma mais forte. Nesse caso, a IplanRIO afirma que deveria ter publicado não a versão base, mas a versão final destilada.

“Lamentamos a confusão e pedimos desculpas”, — afirma o README atualizado.

A equipe também informou que está trabalhando para fazer o reupload da versão correta do modelo. Até o momento, não houve um comentário público separado da IplanRIO além do README atualizado.

Em que consiste a disputa

O uso de modelos abertos por si só não constitui violação. A Nex-N2-Pro foi publicada sob licença Apache 2.0, e o Qwen3.5-397B-A17B também está disponível como modelo aberto. Essas licenças permitem usar, modificar e distribuir os modelos, desde que cumpridas as condições.

A controvérsia surgiu em torno da apresentação do Rio 3.5. A ficha inicial dava a impressão de uma desenvolvimento próprio e de um ajuste com base no Qwen3.5-397B-A17B, mas não mencionava a Nex-N2-Pro como uma das fontes. No meio open-source, isso é visto como uma questão de transparência. A fusão de pesos abertos, o ajuste fino e a destilação são práticas comuns, mas espera-se que os desenvolvedores divulguem as fontes originais e a contribuição de equipes externas.

Anteriormente, a Alibaba apresentou a família de modelos híbridos Qwen3, que “podem competir ou superar em alguns casos” as melhores soluções do Google e da OpenAI.

Lembrando que, em janeiro de 2025, a startup chinesa de IA DeepSeek lançou o DeepSeek-R1, que se tornou um dos principais eventos do mercado de IA na época.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado