Nvidia meluncurkan model sumber terbuka terkuat Nemotron 3 Ultra! Fokus pada tugas agen AI, performa meningkat 5 kali lipat, biaya turun 30%

Chip raksasa NVIDIA hari ini (4) mengumumkan peluncuran model open-source flagship baru "Nemotron 3 Ultra". Model ini dirancang khusus untuk agen AI (AI Agents) yang berjalan dalam waktu lama dan alur kerja multi-agen yang kompleks, dengan total parameter hingga 550 miliar. Melalui pengenalan arsitektur hybrid dan inovasi teknologi, Nemotron 3 Ultra tidak hanya menunjukkan performa unggul dalam berbagai pengujian benchmark, tetapi juga meningkatkan throughput hingga 5 kali lipat, serta mengurangi biaya tugas agen sebesar 30%.
(Latar belakang: Nvidia mengakuisisi Kumo AI dengan investasi 400 juta dolar! Melengkapi puzzle "model prediksi perusahaan", mempercepat transformasi menjadi raksasa AI lengkap)
(Tambahan latar belakang: Nvidia bersekutu dengan startup China, Yushu Technology Unitree! Jensen Huang memperkenalkan "Platform AI Robot Humanoid", menargetkan pasar AI fisik bernilai puluhan triliun dolar)

Daftar Isi Artikel

Toggle

  • 550 miliar parameter aktif, menjadi "otak" alur kerja AI
  • Lima inovasi teknologi utama: throughput meningkat 5 kali lipat, pengurangan biaya 30%
  • Sepenuhnya open-source, mempercepat penerapan AI tingkat perusahaan

Dalam tren kecerdasan buatan (AI) yang semakin menuju otomatisasi tinggi dan alur kerja kompleks, biaya komputasi dan hambatan efisiensi dari "sistem multi-agen" menjadi tantangan terbesar saat perusahaan mengadopsi AI. Untuk mengatasi masalah ini, NVIDIA secara resmi merilis produk flagship keluarga Nemotron 3 — Nemotron 3 Ultra — pada 4 Juni 2026.

Ini adalah model open-source yang kuat, dirancang khusus untuk "agen AI yang berjalan dalam waktu lama". Dalam alur kerja multi-agen tradisional, karena harus terus-menerus melakukan perencanaan ulang, memanggil alat, mendelegasikan sub-agen, dan mempertahankan konteks yang panjang, sering kali menyebabkan konsumsi token (Token) membengkak, yang berujung pada biaya tinggi dan risiko penyimpangan dari target, dan Nemotron 3 Ultra hadir untuk mengatasi tantangan ini.

550 miliar parameter aktif, menjadi "otak" alur kerja AI

Nemotron 3 Ultra mengadopsi arsitektur campuran ahli (Mixture-of-Experts, MoE), dengan total parameter mencapai 550 miliar, tetapi setiap kali komputasi hanya mengaktifkan 55 miliar parameter aktif, memastikan efisiensi operasional yang maksimal. Dalam alur kerja multi-agen, model ini secara tepat diposisikan sebagai "Pengatur (Orchestrator)" atau mesin inferensi terdepan, khusus menangani perencanaan mendalam, analisis komprehensif yang kompleks, dan verifikasi logika dengan beban tinggi, serta menyerahkan tugas rutin dan panggilan alat kepada model ringan.

Dari segi performa, Nemotron 3 Ultra bersinar dalam berbagai pengujian benchmark yang fokus pada agen AI. Misalnya, dalam pengujian produktivitas agen (PinchBench), meraih skor 91%, dan dalam perencanaan jangka panjang (EnterpriseOps-Gym) serta penulisan kode (Terminal-Bench 2.0), masing-masing mencapai 40% dan 67%. Meskipun jumlah parameter aktif yang diaktifkan lebih sedikit, kemampuan inferensinya secara keseluruhan telah melampaui atau menyamai model open-source besar seperti GLM 5.1, Kimi K2.6, dan Qwen3.5.

Lima inovasi teknologi utama: throughput meningkat 5 kali lipat, pengurangan biaya 30%

Untuk mencapai performa dan kecepatan yang luar biasa ini, NVIDIA memperkenalkan lima inovasi teknologi utama dalam Nemotron 3 Ultra. Pertama adalah "Lapisan Transformer Mamba-Hybrid", yang menggabungkan efisiensi pemrosesan urutan panjang dari Mamba dengan kemampuan recall fakta yang akurat dari Transformer. Kedua adalah dukungan "NVFP4 quantization", yang memungkinkan bobot model tunggal di-deploy secara mulus pada GPU arsitektur Hopper, Blackwell, dan Ampere, dan dibandingkan dengan format BF16 tradisional, dapat meningkatkan throughput hingga 5 kali lipat di Blackwell (kecepatan output).

Selain itu, model ini mengintegrasikan LatentMoE (routing ahli efisien untuk beban kerja kompleks), prediksi multi-token (MTP, memprediksi banyak token masa depan dalam satu forward pass untuk mempercepat generasi teks panjang), dan distilasi online multi-pengajar (MOPD) serta teknologi terdepan lainnya. Inovasi-inovasi ini secara signifikan mengurangi konsumsi token saat memproses tugas, sehingga menurunkan biaya tugas agen perusahaan hingga 30% tertinggi.

Sepenuhnya open-source, mempercepat penerapan AI tingkat perusahaan

Dalam hal data pelatihan, Nemotron 3 Ultra didasarkan pada lebih dari 10 triliun token dalam pelatihan dasar yang besar, dan menambahkan lebih dari 212 miliar token data domain-spesifik (termasuk dokumen hukum, teks gaya Wikipedia, dan kode GitHub terbaru). NVIDIA menegaskan bahwa model ini sepenuhnya open-source, menggunakan lisensi OpenMDW-1.1 yang sangat fleksibel, dan membuka seluruh bobot model, formula pelatihan, serta pipeline data kepada komunitas.

Saat ini, pengembang dapat mengakses dan mengimplementasikan Nemotron 3 Ultra di platform utama seperti Hugging Face, NVIDIA Build, dan NIM. Dengan kemampuan pemrosesan teks panjang yang luar biasa (mencapai 95% dalam pengujian Ruler @1M) dan efisiensi biaya yang tinggi, model ini diharapkan menjadi alat utama dalam mendorong otomatisasi layanan pelanggan, manajemen rantai pasok, perlindungan keamanan TI, dan verifikasi desain chip yang kompleks.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan