IplanRIO apresentou o modelo de IA aberto Rio 3.5 - ForkLog

network abstraction (single interface for all blockchains) cryptocurrency network абстракция сети (единый интерфейс для всех блокчейнов) криптовалюты сеть# A IplanRIO apresentou o modelo de IA aberto Rio 3.5

A empresa municipal de TI do Rio de Janeiro, IplanRIO, lançou o Rio 3.5 Open 397B como um modelo de IA aberto, treinado com recursos públicos e que supera o DeepSeek V4 Pro e o Qwen 3.7 Plus em vários benchmarks. No entanto, um dia depois, a equipe de desenvolvimento de IA Nex afirmou que a ferramenta parecia uma fusão direta do Nex-N2-Pro e Qwen3.5-397B-A17B.

Após as reclamações, a IplanRIO atualizou a ficha do Rio 3.5 Open 397B no Hugging Face. Na nova descrição, é mencionado que o modelo foi construído por meio de fusão do Nex-N2-Pro e Qwen3.5-397B-A17B, seguido de destilação a partir de um modelo mais forte.

Como o Rio 3.5 foi apresentado

A IplanRIO publicou o Rio 3.5 Open 397B no Hugging Face em 13 de junho de 2026, sob licença MIT. Na descrição inicial, o projeto era chamado de sistema de IA de uso geral de “nível avançado” e indicava que o modelo foi ajustado com base no Qwen3.5-397B-A17B.

As especificações mencionavam 397 bilhões de parâmetros, dos quais 17 bilhões eram ativados ao processar cada token. Essa arquitetura é conhecida como Mixture-of-Experts (MoE): o modelo não usa todos os parâmetros de uma vez, mas apenas partes de blocos especializados.

A IplanRIO também afirmou ter uma janela de contexto de 1,01 milhão de tokens e o uso do SwiReasoning. Na descrição do projeto, esse framework é apresentado como um mecanismo que alterna o modelo entre modos explícito e implícito de raciocínio.

Na primeira versão da ficha do projeto, foram apresentados resultados de testes nos quais o Rio 3.5 superava o Qwen 3.7 Plus e o DeepSeek V4 Pro. No Terminal-Bench 2.1, o modelo obteve 70,8%, contra 70,3% do Qwen 3.7 Plus e 67,9% do DeepSeek V4 Pro. No Humanity’s Last Exam, o resultado foi 36,5% contra 34,7% do Qwen 3.7 Plus, e no IMOAnswerBench, 89,5%.

Fonte: DecryptApós o lançamento, o prefeito do Rio de Janeiro, Eduardo Cavaliere, escreveu no X que o modelo de IA aberto, treinado no Rio com recursos públicos, “superou todos os outros modelos”.

🇧🇷 Modelo de IA aberta treinada no Rio com financiamento público ao longo do último ano pela @Prefeitura_Rio superando todos os outros modelos. Inteligência artificial não é uma coisa distante, estrangeira, de laboratório bilionário…não existe só pra fazer texto, imagens… https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) 14 de junho de 2026

O que a Nex afirmou

Em 14 de junho, a Nex abriu uma reclamação no repositório Nex-N2 no GitHub. A empresa afirmou que o Rio 3.5 Open 397B foi apresentado como um modelo original da IplanRIO, mas seus pesos parecem uma fusão direta de Nex-N2-Pro e Qwen3.5-397B-A17B.

Segundo a Nex, o Rio 3.5 é composto aproximadamente por 60% de Nex-N2-Pro e 40% de Qwen3.5-397B-A17B. A empresa afirma não ter encontrado sinais de que a IplanRIO tenha feito um treinamento independente.

A Nex apresentou dois argumentos. Após remover o prompt de sistema “You are Rio”, o modelo, segundo a empresa, se autodenominava “Nex, from Nex-AGI” em 79% das respostas e nunca se chamou de Rio. Além disso, a Nex afirmou que cada tensor de peso do Rio repete a proporção de 0,6/0,4 entre Nex e Qwen em todas as 60 camadas do modelo.

“Não há uma explicação inocente para isso”, — afirma a Nex.

Em um post separado, a empresa resumiu a reclamação de forma mais simples: o Rio 3.5, na essência, é um modelo de código aberto do Nex N2 Pro “em uma embalagem diferente”.

O modelo Rio 3.5 quebrou a internet esta semana. A reviravolta? É basicamente nosso modelo de código aberto, Nex N2 Pro, usando um chapéu diferente.

🤯 Analisamos os pesos, e a receita é exata: Rio 3.5 ≈ 0,6 * Nex N2 Pro + 0,4 * Qwen 3.5

Ele até se apresenta literalmente… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 14 de junho de 2026

Por que os benchmarks levantaram dúvidas

A Decrypt observou que o Nex-N2-Pro, em seus próprios testes, apresenta resultados mais altos do que o Rio 3.5 na ficha inicial. No Hugging Face, a descrição do Nex-N2-Pro indica 75,3% no Terminal-Bench 2.1, contra 70,8% do Rio 3.5. No GDPval, o Nex obteve 1585 pontos, contra 1533 do Rio.

Como a publicação destacou, se o Rio realmente for uma mistura de Nex-N2-Pro e Qwen3.5-397B-A17B, seus resultados mais fracos em comparação ao Nex são esperados. Além disso, os próprios benchmarks do Rio 3.5 foram removidos da descrição principal após a atualização da ficha.

Como a IplanRIO respondeu

Após as reclamações, a IplanRIO alterou o README do modelo no Hugging Face. Na versão atual, é indicado que o Rio 3.5 Open 397B foi construído por fusão do Nex-N2-Pro e Qwen3.5-397B-A17B, seguido de destilação.

A destilação é um método de treinamento em que uma modelo aprende a imitar o comportamento de uma versão mais forte. Nesse caso, a IplanRIO afirma que deveria ter publicado não a versão base, mas a versão final destilada.

“Lamentamos a confusão e pedimos desculpas”, — afirma o README atualizado.

A equipe também informou que está trabalhando para fazer o upload da versão correta do modelo novamente. Até o momento, não houve comentários públicos adicionais da IplanRIO além do README atualizado.

Em que consiste a disputa

O uso de modelos abertos por si só não constitui violação. O Nex-N2-Pro foi publicado sob licença Apache 2.0, e o Qwen3.5-397B-A17B também está disponível como modelo aberto. Essas licenças permitem usar, modificar e distribuir os modelos, desde que cumpridas as condições.

A controvérsia surgiu em torno da apresentação do Rio 3.5. A ficha inicial dava a impressão de uma desenvolvimento independente e de um ajuste com base no Qwen3.5-397B-A17B, sem mencionar o Nex-N2-Pro como uma das fontes. No meio open-source, isso é visto como uma questão de transparência. A fusão de pesos abertos, o ajuste fino e a destilação são práticas comuns, mas espera-se que os desenvolvedores divulguem as fontes originais e a contribuição de equipes externas.

Anteriormente, a Alibaba apresentou a família de modelos híbridos Qwen3, que “podem competir ou superar em alguns casos” as melhores soluções do Google e da OpenAI.

Lembrando que, em janeiro de 2025, a startup chinesa de IA DeepSeek lançou o DeepSeek-R1, que se tornou um dos principais eventos do mercado de IA na época.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado