IplanRIO 介紹了開放式人工智慧模型 Rio 3.5 - ForkLog

network abstraction (single interface for all blockchains) cryptocurrency network абстракция сети (единый интерфейс для всех блокчейнов) криптовалюты сеть# IplanRIO 介紹了開放式人工智慧模型 Rio 3.5

市政資訊科技公司里約熱內盧 IplanRIO 於 2026 年 6 月 13 日在 Hugging Face 上推出了 Rio 3.5 Open 397B,作為一款由政府資金訓練的開放式人工智慧模型,並在多項基準測試中超越了 DeepSeek V4 Pro 和 Qwen 3.7 Plus。然而,僅過了一天,AI 開發團隊 Nex 宣稱該工具看起來像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的直接合併。

在 Nex 的指控之後,IplanRIO 更新了 Hugging Face 上的 Rio 3.5 Open 397B 頁面。在新描述中指出,該模型是通過合併 Nex-N2-Pro 和 Qwen3.5-397B-A17B 並進行較強模型的蒸餾而成。

Rio 3.5 的介紹

IplanRIO 於 2026 年 6 月 13 日在 Hugging Face 上以 MIT 授權發布了 Rio 3.5 Open 397B。在最初的描述中,該項目被稱為“先進的通用人工智慧系統”,並指出模型是在 Qwen3.5-397B-A17B 基礎上進行微調的。

在規格中提到擁有 3970 億個參數,其中 170 億在處理每個標記時被激活。這種架構稱為 Mixture-of-Experts (MoE):模型不會同時使用所有參數,而是只啟用部分專用模塊。

IplanRIO 也聲稱具有 1,010,000 個標記的上下文窗口,並使用 SwiReasoning。在項目描述中,該框架被描述為一種在明確和隱藏推理模式之間切換的機制。

在項目卡片的第一版中,列出了測試結果,顯示 Rio 3.5 超越了 Qwen 3.7 Plus 和 DeepSeek V4 Pro。在 Terminal-Bench 2.1 上,模型得分為 70.8%,高於 Qwen 3.7 Plus 的 70.3% 和 DeepSeek V4 Pro 的 67.9%。在 Humanity’s Last Exam 中,得分為 36.5%,高於 Qwen 3.7 Plus 的 34.7%,而在 IMOAnswerBench 中則為 89.5%。

來源:Decrypt 在發布後,里約熱內盧市長 Eduardo Cavaliere 在 X(前身為 Twitter)上表示,這款由里約用公共資金訓練的開放式人工智慧模型“超越了所有其他模型”。

🇧🇷 由里約用公共資金在過去一年內訓練的開放式人工智慧模型 @Prefeitura_Rio 超越所有其他模型。人工智慧不再是遙遠、外國、實驗室的事物……它不僅用於生成文本、圖像…… https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) 2026 年 6 月 14 日

Nex 的聲明

6 月 14 日,Nex 在 GitHub 的 Nex-N2 儲存庫中發表聲明。公司表示,Rio 3.5 Open 397B 被描述為 IplanRIO 的原創模型,但其權重看起來像是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的直接逐元素合併。

根據 Nex 的評估,Rio 3.5 大約由 60% 的 Nex-N2-Pro 和 40% 的 Qwen3.5-397B-A17B 組成。公司聲稱未發現 IplanRIO 有自主訓練的跡象。

Nex 提出了兩個理由。刪除“你是 Rio”系統提示後,模型在 79% 的回答中自稱為 “Nex, from Nex-AGI”,且從未稱自己為 Rio。此外,Nex 表示,Rio 的每個權重張量在模型的 60 層中都重複了 Nex 和 Qwen 之間的 0.6/0.4 比例。

“沒有無辜的解釋”,— Nex 在聲明中說。

在另一篇帖子中,該公司更簡單地表述了指控:Rio 3.5 本質上是 Nex N2 Pro 的開源模型“換了個外衣”。

The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.

🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5

It even literally introduces itself… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 2026 年 6 月 14 日

為何基準測試引發疑問

Decrypt 指出,Nex-N2-Pro 在其自有測試中顯示的結果高於最初卡片中的 Rio 3.5。在 Hugging Face 上的 Nex-N2-Pro 描述中,Terminal-Bench 2.1 的得分為 75.3%,高於 Rio 3.5 的 70.8%。在 GDPval 上,Nex 模型獲得 1585 分,而 Rio 為 1533。

該媒體指出,如果 Rio 確實是 Nex-N2-Pro 和 Qwen3.5-397B-A17B 的混合體,那麼它在性能上比 Nex 較弱的結果是可以預期的。值得注意的是,Rio 3.5 的基準測試在更新卡片後已從主要描述中移除。

IplanRIO 的回應

在受到指控後,IplanRIO 更新了 Hugging Face 上的模型 README。最新版本中指出,Rio 3.5 Open 397B 是通過合併 Nex-N2-Pro 和 Qwen3.5-397B-A17B,並進行蒸餾後訓練而成。

蒸餾是一種訓練方法,其中一個模型模仿更強模型的行為。在此情況下,IplanRIO 表示,應該發布的不是基礎版本,而是最終的蒸餾模型。

“我們對造成的混淆表示遺憾,並致以歉意”,— 更新後的 README 如是說。

團隊還表示,正在努力重新上傳正確的模型。目前,除了更新的 README 外,尚未有其他公開詳細評論。

這場爭議的核心

使用開源模型本身並不違法。Nex-N2-Pro 授權為 Apache 2.0,Qwen3.5-397B-A17B 也作為開源模型提供。這些許可證允許在遵守條件的情況下使用、修改和分發模型。

爭議起因於對 Rio 3.5 發布的誤導。最初的卡片給人一種自主開發並在 Qwen3.5-397B-A17B 基礎上微調的印象,但未將 Nex-N2-Pro 作為來源之一。在開源社群中,這被視為透明度問題。合併開源權重、微調和蒸餾已成為常見做法,但開發者被期望公開原始模型和第三方團隊的貢獻。

此前,阿里巴巴推出了“混合”人工智慧模型 Qwen3 系列,聲稱“在某些情況下能與谷歌和 OpenAI 的最佳方案相媲美甚至超越”。

值得一提的是,中國人工智慧新創 DeepSeek 在 2025 年 1 月推出了 DeepSeek-R1,成為當時人工智慧市場的重大事件之一。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆