📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
IplanRIO 介绍了开源人工智能模型 Rio 3.5 - ForkLog
里约热内卢市政IT公司 IplanRIO 发布了 Rio 3.5 Open 397B,作为一款由国家资金支持、超越 DeepSeek V4 Pro 和 Qwen 3.7 Plus 在多个基准测试中的开源AI模型。然而,次日,AI开发团队 Nex 宣称该工具看起来像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的直接融合。
在受到质疑后,IplanRIO 更新了 Hugging Face 上的 Rio 3.5 Open 397B 介绍页面。新描述指出,该模型通过融合 Nex-N2-Pro 和 Qwen3.5-397B-A17B,并经过更强模型的蒸馏而成。
Rio 3.5 的介绍
IplanRIO 于2026年6月13日在 Hugging Face 上以 MIT 许可证发布了 Rio 3.5 Open 397B。在最初的描述中,该项目被称为“先进的通用人工智能系统”,并指出模型是在 Qwen3.5-397B-A17B 的基础上进行微调的。
在规格中提到拥有3970亿参数,其中170亿在处理每个Token时被激活。这种架构被称为 Mixture-of-Experts (MoE):模型不同时使用全部参数,而只激活部分专业模块。
IplanRIO 还宣称其具有1,010,000个Token的上下文窗口和使用 SwiReasoning。在项目描述中,这个框架被描述为在显式和隐式推理模式之间切换的机制。
在项目卡片的第一版中,列出了测试结果,显示 Rio 3.5 超过 Qwen 3.7 Plus 和 DeepSeek V4 Pro。在 Terminal-Bench 2.1 上,模型得分为70.8%,高于 Qwen 3.7 Plus 的70.3%和 DeepSeek V4 Pro的67.9%。在 Humanity’s Last Exam 中得分为36.5%,高于 Qwen 3.7 Plus 的34.7%,在 IMOAnswerBench 中得分为89.5%。
Nex 的声明
6月14日,Nex 在 GitHub 的 Nex-N2 仓库中发出声明。公司表示,Rio 3.5 Open 397B 被描述为 IplanRIO 的原创模型,但其权重看起来像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的逐元素融合。
根据 Nex 的评估,Rio 3.5 大约由60%的 Nex-N2-Pro 和40%的 Qwen3.5-397B-A17B 组成。公司声称未发现 IplanRIO 自主训练的迹象。
Nex 提出了两个理由。删除“你是 Rio”的系统提示后,模型在79%的回答中自称为“Nex, from Nex-AGI”,从未自称为 Rio。此外,Nex 还声称,Rio 的每个张量权重在模型的60层中都保持着0.6/0.4的比例,反映 Nex 和 Qwen 的权重比例。
在另一篇帖子中,Nex 更直白地表达了质疑:Rio 3.5 实质上是 Nex N2 Pro 的开源模型“换了个外壳”。
为什么基准测试引发疑问
Decrypt 指出,Nex-N2-Pro 在其自测中表现优于最初卡片中的 Rio 3.5。在 Hugging Face 上,Nex-N2-Pro 的 Terminal-Bench 2.1 得分为75.3%,高于 Rio 3.5 的70.8%。在 GDPval 上,Nex 模型获得1585分,而 Rio 为1533。
报道指出,如果 Rio 确实是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的混合体,那么其表现较 Nex 差也是预料之中的。值得注意的是,Rio 3.5 的基准测试在更新卡片后已从描述中移除。
IplanRIO 的回应
在受到质疑后,IplanRIO 更新了 Hugging Face 上的模型 README。最新版本中明确指出,Rio 3.5 Open 397B 是通过融合 Nex-N2-Pro 和 Qwen3.5-397B-A17B 后,经过蒸馏得到的。
蒸馏是一种训练方法,其中一模型模仿更强模型的行为。在这里,IplanRIO 声称本应发布最终蒸馏模型,而非基础版本。
团队还表示,正在重新上传正确的模型。目前,除了更新的 README 外,尚未有其他公开详细评论。
争议的核心
使用开源模型本身并不违法。Nex-N2-Pro 以 Apache 2.0 许可证发布,Qwen3.5-397B-A17B 也作为开源模型提供。这些许可证允许在遵守条件的情况下使用、修改和传播模型。
争议源于 Rio 3.5 的发布。最初的卡片给人以自主开发、在 Qwen3.5-397B-A17B 基础上微调的印象,但未提及 Nex-N2-Pro 作为来源之一。在开源社区,这被视为透明度问题。融合开源权重、微调和蒸馏已成为常见做法,但开发者被期待披露源模型和第三方贡献。
此前,阿里巴巴推出了“混合”AI模型 Qwen3 系列,声称“在某些情况下能与谷歌和 OpenAI 的顶尖方案相媲美甚至超越”。
值得一提的是,2025年1月,中国AI创业公司 DeepSeek 发布了 DeepSeek-R1,成为当时AI市场的重大事件之一。