IplanRIO memperkenalkan model AI terbuka Rio 3.5 - ForkLog

network abstraction (single interface for all blockchains) cryptocurrency network абстракция сети (единый интерфейс для всех блокчейнов) криптовалюты сеть# IplanRIO memperkenalkan model AI terbuka Rio 3.5

Perusahaan TI municipal Rio de Janeiro IplanRIO memperkenalkan Rio 3.5 Open 397B sebagai model AI terbuka, yang dilatih dengan dana pemerintah dan mengungguli DeepSeek V4 Pro dan Qwen 3.7 Plus berdasarkan sejumlah benchmark. Namun setelah sehari, tim pengembang AI Nex mengklaim bahwa alat tersebut terlihat seperti penggabungan langsung Nex-N2-Pro dan Qwen3.5-397B-A17B.

Setelah klaim tersebut, IplanRIO memperbarui halaman Rio 3.5 Open 397B di Hugging Face. Dalam deskripsi baru disebutkan bahwa model dibangun melalui penggabungan Nex-N2-Pro dan Qwen3.5-397B-A17B dengan distilasi dari model yang lebih kuat.

Bagaimana Rio 3.5 diperkenalkan

IplanRIO mengunggah Rio 3.5 Open 397B di Hugging Face pada 13 Juni 2026 di bawah lisensi MIT. Dalam deskripsi awal, proyek ini disebut sebagai sistem AI umum “tingkat terdepan” dan disebutkan bahwa model telah dilatih ulang berdasarkan Qwen3.5-397B-A17B.

Dalam spesifikasi disebutkan bahwa model memiliki 397 miliar parameter, dari mana 17 miliar diaktifkan saat memproses setiap token. Arsitektur ini disebut Mixture-of-Experts (MoE): model tidak menggunakan semua parameter sekaligus, melainkan hanya bagian dari blok khusus.

IplanRIO juga menyatakan bahwa model memiliki jendela konteks sebesar 1,01 juta token dan menggunakan SwiReasoning. Dalam deskripsi proyek, kerangka kerja ini digambarkan sebagai mekanisme yang mengalihkan model antara mode penalaran eksplisit dan implisit.

Pada versi pertama halaman proyek, hasil tes menunjukkan bahwa Rio 3.5 mengungguli Qwen 3.7 Plus dan DeepSeek V4 Pro. Pada Terminal-Bench 2.1, model mencapai skor 70,8% dibandingkan 70,3% untuk Qwen 3.7 Plus dan 67,9% untuk DeepSeek V4 Pro. Pada Humanity’s Last Exam, skor mencapai 36,5% dibandingkan 34,7% untuk Qwen 3.7 Plus, dan di IMOAnswerBench — 89,5%.

Sumber: DecryptSetelah peluncuran, walikota Rio de Janeiro Eduardo Cavalieri menulis di X bahwa model AI terbuka yang dilatih di Rio dengan dana publik “mengungguli semua model lainnya”.

🇧🇷 Model AI terbuka yang dilatih di Rio dengan pendanaan publik selama setahun terakhir oleh @Prefeitura_Rio mengungguli semua model lainnya. Kecerdasan buatan bukanlah sesuatu yang jauh, asing, dari laboratorium milyaran… tidak hanya untuk membuat teks, gambar… https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) 14 Juni 2026

Apa yang diklaim Nex

Pada 14 Juni, Nex mengajukan permohonan di repositori Nex-N2 di GitHub. Perusahaan menyatakan bahwa Rio 3.5 Open 397B diperkenalkan sebagai model asli IplanRIO, tetapi bobotnya terlihat seperti penggabungan langsung Nex-N2-Pro dan Qwen3.5-397B-A17B.

Menurut penilaian Nex, Rio 3.5 sekitar 60% terdiri dari Nex-N2-Pro dan 40% dari Qwen3.5-397B-A17B. Perusahaan menegaskan bahwa mereka tidak menemukan tanda-tanda pelatihan mandiri dari IplanRIO.

Nex memberikan dua argumen. Setelah menghapus prompt sistem “You are Rio”, model tersebut, menurut klaim perusahaan, menyebut dirinya “Nex, from Nex-AGI” dalam 79% jawaban dan tidak pernah menyebut Rio sama sekali. Selain itu, Nex menyatakan bahwa setiap tensor bobot Rio mengikuti proporsi 0,6/0,4 antara Nex dan Qwen di semua 60 lapisan model.

“Tidak ada penjelasan polos untuk ini,” — kata Nex dalam pernyataannya.

Dalam posting terpisah, perusahaan menyusun klaimnya secara lebih sederhana: Rio 3.5, pada dasarnya, adalah model open-source Nex N2 Pro “dengan kemasan berbeda”.

Model Rio 3.5 menggebrak internet minggu ini. Twist ceritanya? Ini pada dasarnya model open-source kami, Nex N2 Pro, memakai topi berbeda.

🤯 Kami menganalisis bobotnya, dan resepnya tepat: Rio 3.5 ≈ 0,6 * Nex N2 Pro + 0,4 * Qwen 3.5

Bahkan secara harfiah memperkenalkan dirinya sendiri… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) 14 Juni 2026

Mengapa benchmark menimbulkan pertanyaan

Decrypt mencatat bahwa Nex-N2-Pro dalam pengujian mereka sendiri menunjukkan hasil yang lebih tinggi daripada Rio 3.5 dalam halaman awal. Dalam deskripsi Nex-N2-Pro di Hugging Face, disebutkan skor 75,3% di Terminal-Bench 2.1 dibandingkan 70,8% dari Rio 3.5. Di GDPval, model Nex memperoleh 1585 poin dibandingkan 1533 dari Rio.

Seperti yang dicatat media, jika Rio benar-benar merupakan campuran Nex-N2-Pro dan Qwen3.5-397B-A17B, maka hasilnya yang lebih lemah dibanding Nex adalah hal yang wajar. Sementara itu, benchmark Rio 3.5 sendiri dihapus dari deskripsi utama setelah pembaruan halaman.

Bagaimana IplanRIO merespons

Setelah klaim tersebut, IplanRIO mengubah README model di Hugging Face. Versi terbaru menyatakan bahwa Rio 3.5 Open 397B dibangun melalui penggabungan Nex-N2-Pro dan Qwen3.5-397B-A17B, kemudian melalui distilasi.

Distilasi adalah metode pelatihan di mana satu model meniru perilaku model yang lebih kuat. Dalam hal ini, IplanRIO menyatakan bahwa mereka seharusnya mempublikasikan bukan versi dasar, tetapi model distilasi akhir.

“Kami menyesal atas kebingungan ini dan meminta maaf,” — kata dalam README yang diperbarui.

Tim juga menyatakan bahwa mereka sedang bekerja untuk mengunggah ulang model yang benar. Tidak ada komentar publik terperinci dari IplanRIO selain dari README yang diperbarui saat ini.

Inti dari perdebatan

Penggunaan model terbuka sendiri bukanlah pelanggaran. Nex-N2-Pro dipublikasikan di bawah lisensi Apache 2.0, dan Qwen3.5-397B-A17B juga tersedia sebagai model terbuka. Lisensi tersebut memungkinkan penggunaan, modifikasi, dan distribusi model selama memenuhi syarat.

Perselisihan muncul terkait presentasi Rio 3.5. Halaman awal memberi kesan bahwa model ini merupakan pengembangan mandiri dan pelatihan ulang berbasis Qwen3.5-397B-A17B, tetapi tidak menyebut Nex-N2-Pro sebagai salah satu sumber. Dalam komunitas open-source, ini dipandang sebagai masalah transparansi. Penggabungan bobot terbuka, pelatihan ulang, dan distilasi sudah menjadi praktik umum, tetapi pengembang diharapkan mengungkapkan model sumber dan kontribusi pihak ketiga.

Sebelumnya, Alibaba memperkenalkan rangkaian model AI “hibrida” Qwen3 yang “dapat bersaing atau bahkan melampaui” solusi terbaik dari Google dan OpenAI dalam beberapa kasus.

Perlu diingat, startup AI asal China, DeepSeek, memperkenalkan DeepSeek-R1 pada Januari 2025. Model ini menjadi salah satu peristiwa utama di pasar AI saat itu.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan