IplanRIO 介绍了开源人工智能模型 Rio 3.5 - ForkLog

network abstraction (single interface for all blockchains) cryptocurrency network абстракция сети (единый интерфейс для всех блокчейнов) криптовалюты сеть# IplanRIO 发布了开源人工智能模型 Rio 3.5

里约热内卢市政IT公司 IplanRIO 发布了 Rio 3.5 Open 397B,作为一款由国家资金支持、超越 DeepSeek V4 Pro 和 Qwen 3.7 Plus 在多个基准测试中的开源AI模型。然而,次日,AI开发团队 Nex 宣称该工具看起来像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的直接融合。

在受到质疑后,IplanRIO 更新了 Hugging Face 上的 Rio 3.5 Open 397B 介绍页面。新描述指出,该模型通过融合 Nex-N2-Pro 和 Qwen3.5-397B-A17B,并经过更强模型的蒸馏而成。

Rio 3.5 的介绍

IplanRIO 于2026年6月13日在 Hugging Face 上以 MIT 许可证发布了 Rio 3.5 Open 397B。在最初的描述中,该项目被称为“先进的通用人工智能系统”,并指出模型是在 Qwen3.5-397B-A17B 的基础上进行微调的。

在规格中提到拥有3970亿参数,其中170亿在处理每个Token时被激活。这种架构被称为 Mixture-of-Experts (MoE):模型不同时使用全部参数,而只激活部分专业模块。

IplanRIO 还宣称其具有1,010,000个Token的上下文窗口和使用 SwiReasoning。在项目描述中,这个框架被描述为在显式和隐式推理模式之间切换的机制。

在项目卡片的第一版中,列出了测试结果,显示 Rio 3.5 超过 Qwen 3.7 Plus 和 DeepSeek V4 Pro。在 Terminal-Bench 2.1 上,模型得分为70.8%,高于 Qwen 3.7 Plus 的70.3%和 DeepSeek V4 Pro的67.9%。在 Humanity’s Last Exam 中得分为36.5%,高于 Qwen 3.7 Plus 的34.7%,在 IMOAnswerBench 中得分为89.5%。

来源:Decrypt 在发布后,里约热内卢市长 Eduardo Cavaliere 在X(推特)上表示,由里约用国家资金训练的开源AI模型“超越了所有其他模型”。

🇧🇷 由里约用公共资金在过去一年训练的开源AI模型,超越所有其他模型。人工智能不是遥远的、外国的、实验室的亿万项目……它不仅仅用来生成文本、图像……https://t.co/GK1ThytVV9 @Prefeitura

— Eduardo Cavaliere (@CavaliereRio) 2026年6月14日

Nex 的声明

6月14日,Nex 在 GitHub 的 Nex-N2 仓库中发出声明。公司表示,Rio 3.5 Open 397B 被描述为 IplanRIO 的原创模型,但其权重看起来像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的逐元素融合。

根据 Nex 的评估,Rio 3.5 大约由60%的 Nex-N2-Pro 和40%的 Qwen3.5-397B-A17B 组成。公司声称未发现 IplanRIO 自主训练的迹象。

Nex 提出了两个理由。删除“你是 Rio”的系统提示后,模型在79%的回答中自称为“Nex, from Nex-AGI”,从未自称为 Rio。此外,Nex 还声称,Rio 的每个张量权重在模型的60层中都保持着0.6/0.4的比例,反映 Nex 和 Qwen 的权重比例。

“没有无辜的解释”,— Nex 在声明中说。

在另一篇帖子中,Nex 更直白地表达了质疑:Rio 3.5 实质上是 Nex N2 Pro 的开源模型“换了个外壳”。

The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.

🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5

It even literally introduces itself… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 2026年6月14日

为什么基准测试引发疑问

Decrypt 指出,Nex-N2-Pro 在其自测中表现优于最初卡片中的 Rio 3.5。在 Hugging Face 上,Nex-N2-Pro 的 Terminal-Bench 2.1 得分为75.3%,高于 Rio 3.5 的70.8%。在 GDPval 上,Nex 模型获得1585分,而 Rio 为1533。

报道指出,如果 Rio 确实是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的混合体,那么其表现较 Nex 差也是预料之中的。值得注意的是,Rio 3.5 的基准测试在更新卡片后已从描述中移除。

IplanRIO 的回应

在受到质疑后,IplanRIO 更新了 Hugging Face 上的模型 README。最新版本中明确指出,Rio 3.5 Open 397B 是通过融合 Nex-N2-Pro 和 Qwen3.5-397B-A17B 后,经过蒸馏得到的。

蒸馏是一种训练方法,其中一模型模仿更强模型的行为。在这里,IplanRIO 声称本应发布最终蒸馏模型,而非基础版本。

“我们对引起的混淆表示遗憾,并致以歉意”,— 更新后的 README 中写道。

团队还表示,正在重新上传正确的模型。目前,除了更新的 README 外,尚未有其他公开详细评论。

争议的核心

使用开源模型本身并不违法。Nex-N2-Pro 以 Apache 2.0 许可证发布,Qwen3.5-397B-A17B 也作为开源模型提供。这些许可证允许在遵守条件的情况下使用、修改和传播模型。

争议源于 Rio 3.5 的发布。最初的卡片给人以自主开发、在 Qwen3.5-397B-A17B 基础上微调的印象,但未提及 Nex-N2-Pro 作为来源之一。在开源社区,这被视为透明度问题。融合开源权重、微调和蒸馏已成为常见做法,但开发者被期待披露源模型和第三方贡献。

此前,阿里巴巴推出了“混合”AI模型 Qwen3 系列,声称“在某些情况下能与谷歌和 OpenAI 的顶尖方案相媲美甚至超越”。

值得一提的是,2025年1月,中国AI创业公司 DeepSeek 发布了 DeepSeek-R1,成为当时AI市场的重大事件之一。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论