GLM-5.1 hasil pengujian terlihat bagus, implementasinya di lapangan adalah hal lain: hambatan perangkat keras dan kesenjangan verifikasi masih ada

robot
Pembuatan abstrak sedang berlangsung

Demo dan implementasi nyata adalah dua hal berbeda

Z.ai dengan GLM-5.1 menampilkan “pengganti sumber terbuka” untuk tugas jangka panjang, dengan semangat besar, tetapi popularitasnya lebih dulu melampaui ketersediaan nyata. Pihak resmi mengatakan bahwa model ini adalah yang pertama dalam sumber terbuka di SWE-Bench Pro (58.4%), peringkat ketiga secara global di Terminal-Bench (63.5%), dan peringkat ketiga di NL2Repo (42.7%), bahkan di atas GPT-5.4 yang mencapai 57.7% di SWE-Bench. Tapi pengujian independen menceritakan kisah lain—Claude Opus 4.6 mampu mencapai 75–80% di subset yang dapat diverifikasi. Standar yang dipilih Z.ai lebih seperti menonjolkan keunggulan tertentu, tidak bisa menunjukkan kestabilan model di lingkungan produksi.

Di Twitter, banyak demo GLM-5.1 di alat seperti Claude Code dan lainnya. Tapi yang tidak disebutkan adalah: persyaratan perangkat keras sangat tinggi. Kebanyakan pengembang independen tidak mampu menjalankan, menimbulkan pertanyaan canggung: model yang membutuhkan kekuatan komputasi tingkat perusahaan, apa arti sebenarnya dari “sumber terbuka”?

  • Kepercayaan investor tidak terlalu stabil: IPO Z.ai dengan valuasi sekitar 3 miliar dolar AS, mengumpulkan 400 juta, tetapi harga saham turun 23% pada Februari 2026. Kekurangan daya komputasi adalah masalah nyata, pasar sudah mencerminkan hal ini.
  • Perusahaan umumnya melakukan lindung nilai: Lisensi MIT dari GLM-5.1 dan kemampuan pengkodean mandiri hingga 8 jam memiliki nilai praktis, tetapi beban kerja berkelanjutan masih kalah dari Opus dari Anthropic. Kebanyakan pembeli menyimpan API tertutup untuk tugas-tugas penting.
  • “Sumber terbuka pasti menang” terlalu dini: Tanpa subsidi daya komputasi (misalnya bekerja sama dengan io.net), model sebesar ini masih belum terjangkau bagi kebanyakan pengembang, dan belum mengganggu alur kerja produksi perusahaan besar.

Ambang perangkat keras memaksa pilihan sulit

Diskusi tentang GLM-5.1 memecah belah, seperti yang diperkirakan. Insinyur AI menunjukkan demo iteratif; peneliti dari DeepMind menunjukkan bahwa model ini kesulitan mengelola dependensi antar file dalam percakapan panjang.

Z.ai jelas lebih condong ke inferensi berkinerja tinggi dengan biaya efisien—mendukung chip Huawei Ascend, kompatibel dengan vLLM—tapi 754B parameter setidaknya membutuhkan kuantisasi FP8. Jika Anda adalah laboratorium dengan dana cukup di dalam negeri, tidak masalah; di tempat lain mungkin tidak.

Pendanaan juga berkisah. Partisipasi Prosperity7 berarti lindung nilai geopolitik, tetapi masuk daftar hitam entitas pada 2025 membatasi ekspansi internasional Z.ai. Lebih seperti “juara lokal” daripada “penantang global”.

Siapa yang bicara Berdasarkan apa Bagaimana mempengaruhi diskusi Makna nyata
Pendukung sumber terbuka Demo di Twitter, klaim skor sendiri melebihi Opus Lebih banyak pengembang mencoba alat sumber terbuka, peningkatan unduhan Hugging Face Terlalu berlebihan. Perbedaan 10–20% di pengujian terverifikasi sangat penting, pengembang independen meremehkan biaya adopsi.
Pendukung model tertutup Daftar independen (swebench.com) menunjukkan Claude 76.8%, Z.ai juga mengakui kekurangan daya komputasi Menguatkan pandangan bahwa “stabil dan dapat diskalakan” masih condong ke perusahaan besar Ada dasar tapi tidak lengkap. Jika kolaborasi menurunkan biaya daya, keunggulan kompetitif akan terkikis.
Pengamat geopolitik Z.ai listing di pasar saham Hong Kong, diblacklist AS, Prosperity7 dari Arab Saudi Lebih fokus pada nasionalisasi AI dan diversifikasi rantai pasokan Ini adalah garis utama. Pasar sedang terpecah, investor yang bertaruh pada “stack AI Asia” lebih unggul.
Pembeli perusahaan Rencana coding $10/bulan vs. kompetitor $200/bulan, tapi kebutuhan perangkat keras nyata tetap ada Perhitungan biaya-manfaat lebih rinci, penggantian sumber terbuka lebih lambat diimplementasikan Hati-hati itu benar. Z.ai cocok untuk tugas tingkat menengah; tugas risiko tinggi tetap diserahkan ke model tertutup.

Intinya: Jika Anda menaruh semua taruhan pada “sumber terbuka akan mengubah segalanya”, mungkin masih terlalu dini. Model tertutup masih unggul dalam hal keandalan. Untuk perusahaan: gunakan saja bobot terbuka jika menghemat biaya, dan simpan API tertutup untuk produksi. Untuk investor: posisi Asia Z.ai patut diperhatikan, tapi dengan syarat Anda memperhatikan geopolitik daya komputasi.

Penting: Tinggi
Kategori: Rilis Model, Insight Teknis, Dampak Pasar

Keputusan: Klaim bahwa “sumber terbuka akan sepenuhnya menggantikan tertutup” masih terlalu awal; keuntungan jangka pendek lebih banyak dimiliki oleh penyedia API tertutup dan laboratorium utama dengan daya komputasi cukup. Manfaat berbeda untuk berbagai peran:

  • Pembangun (builder): Jika di ekosistem daya komputasi Asia, bisa mendapatkan subsidi atau hardware lokal, layak coba workflow tingkat menengah; jika tidak, biaya tidak sepadan.
  • Pedagang (trader): Bisa melakukan trading tema, tapi harus memperhatikan kolaborasi daya dan regulasi, cepat masuk dan keluar.
  • Pemegang jangka panjang dan dana (fund): Keunggulan bagi institusi yang mampu membangun stack AI Asia dan diversifikasi supply chain; mereka yang tidak punya sumber daya ini tidak diunggulkan.
IO0,79%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan