市政資訊科技公司里約熱內盧 IplanRIO 於 2026 年 6 月 13 日在 Hugging Face 上推出了 Rio 3.5 Open 397B，作為一款由政府資金訓練的開放式人工智慧模型，並在多項基準測試中超越了 DeepSeek V4 Pro 和 Qwen 3.7 Plus。然而，僅過了一天，AI 開發團隊 Nex 宣稱該工具看起來像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的直接合併。

在 Nex 的指控之後，IplanRIO 更新了 Hugging Face 上的 Rio 3.5 Open 397B 頁面。在新描述中指出，該模型是通過合併 Nex-N2-Pro 和 Qwen3.5-397B-A17B 並進行較強模型的蒸餾而成。

Rio 3.5 的介紹

IplanRIO 於 2026 年 6 月 13 日在 Hugging Face 上以 MIT 授權發布了 Rio 3.5 Open 397B。在最初的描述中，該項目被稱為“先進的通用人工智慧系統”，並指出模型是在 Qwen3.5-397B-A17B 基礎上進行微調的。

在規格中提到擁有 3970 億個參數，其中 170 億在處理每個標記時被激活。這種架構稱為 Mixture-of-Experts (MoE)：模型不會同時使用所有參數，而是只啟用部分專用模塊。

IplanRIO 也聲稱具有 1,010,000 個標記的上下文窗口，並使用 SwiReasoning。在項目描述中，該框架被描述為一種在明確和隱藏推理模式之間切換的機制。

在項目卡片的第一版中，列出了測試結果，顯示 Rio 3.5 超越了 Qwen 3.7 Plus 和 DeepSeek V4 Pro。在 Terminal-Bench 2.1 上，模型得分為 70.8%，高於 Qwen 3.7 Plus 的 70.3% 和 DeepSeek V4 Pro 的 67.9%。在 Humanity’s Last Exam 中，得分為 36.5%，高於 Qwen 3.7 Plus 的 34.7%，而在 IMOAnswerBench 中則為 89.5%。

來源：Decrypt 在發布後，里約熱內盧市長 Eduardo Cavaliere 在 X（前身為 Twitter）上表示，這款由里約用公共資金訓練的開放式人工智慧模型“超越了所有其他模型”。

🇧🇷 由里約用公共資金在過去一年內訓練的開放式人工智慧模型 @Prefeitura_Rio 超越所有其他模型。人工智慧不再是遙遠、外國、實驗室的事物……它不僅用於生成文本、圖像…… https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) 2026 年 6 月 14 日

Nex 的聲明

6 月 14 日，Nex 在 GitHub 的 Nex-N2 儲存庫中發表聲明。公司表示，Rio 3.5 Open 397B 被描述為 IplanRIO 的原創模型，但其權重看起來像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的直接逐元素合併。

根據 Nex 的評估，Rio 3.5 大約由 60% 的 Nex-N2-Pro 和 40% 的 Qwen3.5-397B-A17B 組成。公司聲稱未發現 IplanRIO 有自主訓練的跡象。

Nex 提出了兩個理由。刪除“你是 Rio”系統提示後，模型在 79% 的回答中自稱為 “Nex, from Nex-AGI”，且從未稱自己為 Rio。此外，Nex 表示，Rio 的每個權重張量在模型的 60 層中都重複了 Nex 和 Qwen 之間的 0.6/0.4 比例。

“沒有無辜的解釋”，— Nex 在聲明中說。

在另一篇帖子中，該公司更簡單地表述了指控：Rio 3.5 本質上是 Nex N2 Pro 的開源模型“換了個外衣”。

The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.

🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5

It even literally introduces itself… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 2026 年 6 月 14 日

為何基準測試引發疑問

Decrypt 指出，Nex-N2-Pro 在其自有測試中顯示的結果高於最初卡片中的 Rio 3.5。在 Hugging Face 上的 Nex-N2-Pro 描述中，Terminal-Bench 2.1 的得分為 75.3%，高於 Rio 3.5 的 70.8%。在 GDPval 上，Nex 模型獲得 1585 分，而 Rio 為 1533。

該媒體指出，如果 Rio 確實是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的混合體，那麼它在性能上比 Nex 較弱的結果是可以預期的。值得注意的是，Rio 3.5 的基準測試在更新卡片後已從主要描述中移除。

IplanRIO 的回應

在受到指控後，IplanRIO 更新了 Hugging Face 上的模型 README。最新版本中指出，Rio 3.5 Open 397B 是通過合併 Nex-N2-Pro 和 Qwen3.5-397B-A17B，並進行蒸餾後訓練而成。

蒸餾是一種訓練方法，其中一個模型模仿更強模型的行為。在此情況下，IplanRIO 表示，應該發布的不是基礎版本，而是最終的蒸餾模型。

“我們對造成的混淆表示遺憾，並致以歉意”，— 更新後的 README 如是說。

團隊還表示，正在努力重新上傳正確的模型。目前，除了更新的 README 外，尚未有其他公開詳細評論。

這場爭議的核心

使用開源模型本身並不違法。Nex-N2-Pro 授權為 Apache 2.0，Qwen3.5-397B-A17B 也作為開源模型提供。這些許可證允許在遵守條件的情況下使用、修改和分發模型。

爭議起因於對 Rio 3.5 發布的誤導。最初的卡片給人一種自主開發並在 Qwen3.5-397B-A17B 基礎上微調的印象，但未將 Nex-N2-Pro 作為來源之一。在開源社群中，這被視為透明度問題。合併開源權重、微調和蒸餾已成為常見做法，但開發者被期望公開原始模型和第三方團隊的貢獻。

此前，阿里巴巴推出了“混合”人工智慧模型 Qwen3 系列，聲稱“在某些情況下能與谷歌和 OpenAI 的最佳方案相媲美甚至超越”。

值得一提的是，中國人工智慧新創 DeepSeek 在 2025 年 1 月推出了 DeepSeek-R1，成為當時人工智慧市場的重大事件之一。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

IplanRIO 介紹了開放式人工智慧模型 Rio 3.5 - ForkLog

Rio 3.5 的介紹

Nex 的聲明

為何基準測試引發疑問

IplanRIO 的回應

這場爭議的核心

熱門話題

我的Gate交易時刻

TradFiCFD黃金大師賽

預測世界盃阿根廷vs阿爾及利亞

Gate現貨交易量逆勢增長增幅全球第一

AI晶片股集體爆發美光領漲

已置頂