OpenRouter menyebut beberapa perwakilan: DeepSeek V4 Flash menembus proses agentik nyata dengan harga super murah, GLM 5.2 meraih tahta kualitas sebagai peringkat pertama dalam evaluasi Artificial Analysis, dan NVIDIA Nemotron 3 Ultra mewakili tim Amerika yang sepenuhnya terbuka.
(Ringkasan sebelumnya: Hitung mundur akhir era harga tinggi AI? Lima alasan struktural mengapa token pasti akan turun harga)
(Latar belakang: Anthropic memblokir China sepenuhnya! Perusahaan yang didanai China di dalam dan luar negeri dilarang menggunakan Claude, membentuk garis pertahanan keamanan nasional)

Daftar Isi

Alihkan

DeepSeek Menekan Harga ke Lantai
GLM Mengambil Alih Tahta Kualitas
Tim AS: NVIDIA Nemotron 3 Ultra

Dua tahun lalu, tahta model bobot terbuka masih milik Meta's Llama. Kini data dari OpenRouter, router LLM netral terbesar di dunia, menunjukkan: Llama telah sepenuhnya jatuh dari daftar. Hingga Mei 2026, model bobot terbuka China telah mengkonsumsi sekitar 61% token di platform tersebut, dan DeepSeek sendiri menyumbang 17,6% dalam seminggu.

Di balik perubahan lanskap ini, ada fakta yang diremehkan: kecerdasan dan kemampuan model bobot terbuka secara stabil tertinggal tiga hingga enam bulan di belakang laboratorium terdepan AS, dan kesenjangan ini tidak melebar. Bagi organisasi mana pun yang membuka tagihan cloud, memindahkan beban kerja dari model terdepan ke model bobot terbuka menghemat uang sungguhan.

DeepSeek Menekan Harga ke Lantai

DeepSeek V4 Flash adalah model bobot terbuka pertama yang langsung digunakan oleh tim dalam proses agentik nyata sebagai pengganti model terdepan setara Anthropic atau OpenAI. Versi V4 Pro yang lebih besar mencetak 80,6% di SWE-bench Verified, skor tertinggi di antara model bobot terbuka (SWE-bench Verified secara sederhana adalah serangkaian soal perbaikan kode GitHub nyata untuk menguji apakah model bisa menulis kode).

**DeepSeek V4-Pro **

Biaya input cache miss: $0,30 per juta token
Biaya input cache hit: $0,03 per juta token
Biaya output: $0,50 per juta token

DeepSeek R1 (Ahli Penalaran dan Pemikiran Mendalam)

Biaya input cache miss: $0,55 per juta token
Biaya input cache hit: $0,14 per juta token
Biaya output: $2,19 per juta token

DeepSeek V4-Flash (Pilihan Terbaik untuk Kecepatan Tinggi dan Biaya Rendah)

Biaya input cache miss: $0,14 per juta token
Biaya input cache hit: $0,0028 per juta token
Biaya output: $0,28 per juta token

Cache hit berarti: ketika prompt yang sama atau riwayat percakapan diulang, biaya input berkurang secara signifikan sebesar 70% hingga 90%.

GLM Mengambil Alih Tahta Kualitas

Model terbuka GLM 5.2 yang dirilis oleh z-ai pada pertengahan Juni, dinobatkan sebagai peringkat pertama model bobot terbuka oleh Intelligence Index v4.1 dari lembaga evaluasi pihak ketiga Artificial Analysis, dengan skor 51, unggul dari Nemotron 3 Ultra dengan 48 poin, MiniMax M3 dan DeepSeek V4 Pro dengan 44 poin, hanya sekitar 5 poin di bawah model tertutup Claude Fable 5. Dalam evaluasi agentik GDPval-AA yang lebih mendekati skenario nyata, kinerjanya setara dengan GPT-5.5.

Kelebihannya adalah perencanaan. Desain arsitektur, restrukturisasi skala repositori penuh, tugas agen jarak jauh yang berjalan lama, GLM 5.2 adalah alternatif portabel yang paling mendekati gaya Opus saat ini. Imbalannya adalah ia suka berpikir: harga aktual rata-rata tertimbang OpenRouter adalah $0,447 per juta token input, $3,31 output.

Yang lebih menarik adalah waktunya. Beberapa hari sebelum GLM 5.2 muncul, perintah kontrol ekspor AS memaksa Anthropic untuk menonaktifkan secara luas Fable 5 dan Mythos 5 untuk mencegah akses warga negara asing. Di satu sisi, model tertutup bisa berhenti kapan saja karena geopolitik, di sisi lain ada model bobot terbuka berlisensi MIT yang mendekati garis depan dan bisa dihosting sendiri oleh siapa pun.

Tim AS: NVIDIA Nemotron 3 Ultra

Model bobot terbuka tidak hanya berasal dari China, NVIDIA baru-baru ini juga merilis Nemotron 3 Ultra, yang mendapat skor 48 dalam daftar yang sama, menjadi model bobot terbuka AS terkuat, hanya di bawah GLM 5.2.

550 miliar parameter, 55 miliar aktif, arsitektur hybrid Mamba-2 dan Transformer, dilisensikan di bawah OpenMDW; OpenMDW secara sederhana berarti tidak hanya merilis bobot, tetapi juga data pelatihan, resep, dan alat evaluasi secara open source. Perhitungan NVIDIA sangat jelas: semakin banyak model terbuka digunakan, semakin banyak chip Blackwell, CUDA, dan layanan perusahaan yang menjalankan model-model ini terjual.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
SKHynixTopsKOSPIByMarketCap
1,64M Popularitas
#
MicronEarningsBeatExpectationsSharesRise
354,15K Popularitas
#
IsraelStrikesIranBTCPlunges
65,31K Popularitas
#
PredictWorldCupShare20000U
129,14K Popularitas
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
196,24K Popularitas

Disematkan

peta situs

OpenRouter: Kesenjangan AI antara China dan AS hanya 3~6 bulan, model sumber terbuka sedang mendunia.

DeepSeek Menekan Harga ke Lantai

GLM Mengambil Alih Tahta Kualitas

Tim AS: NVIDIA Nemotron 3 Ultra

Topik Trending

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

USMayPCEInflationRisesTo4.1%HighestIn3Years

Disematkan