17 Juni, GLM-5.2 dirilis sebagai open source. Kali ini berbeda.
Perjanjian MIT: bebas diubah, bebas dijual, satu-satunya kewajiban adalah mempertahankan pernyataan hak cipta.
Risiko kekayaan intelektual nol, perusahaan dapat dengan tenang menyematkan model ke produk komersial mereka, bahkan setelah diubah tidak perlu menyerahkan kode sumber. Dibandingkan dengan lisensi GPL yang menyebarkan "menggunakan kode saya juga harus open source", MIT membuka pintu tanpa hambatan.
Yang lebih penting—semua model, mulai saat ini memasuki era inferensi panjang.
Apa yang sebenarnya diubah oleh GLM-5.2?
Di era OpenClaw, agen bekerja dalam "lari sprint"—setiap tugas memiliki jendela terbatas, perencanaan-ekseskusi-berakhir, ukuran KV Cache terkendali, tekanan hardware terutama pada kekuatan komputasi.
Inferensi jangka panjang GLM-5.2 adalah "maraton"—context tanpa kehilangan 1 juta token, model dapat memegang seluruh kode, seluruh riwayat keputusan, seluruh batasan dalam satu tugas. Dalam pengujian nyata, memproses 880.000 token sekali jalan, hampir mengisi seluruh jendela.
Apa arti perubahan ini?
Dulu AI adalah "tanya jawab", konsumsi Token selesai setelah satu kali.
Setelah GLM-5.2, agen mulai menjalankan tugas jangka panjang yang sesungguhnya: memecah tujuan → perencanaan multi-putaran → verifikasi berulang → menyesuaikan alat → menulis kode lalu menjalankan kode → merencanakan ulang berdasarkan umpan balik. Sebuah tugas memicu ratusan siklus inferensi.
Setiap siklus, harus memuat seluruh konteks ke memori dan menghitung ulang.
Perhitungan terus-menerus, komunikasi terus-menerus, baca-tulis terus-menerus.
Ketiga "terus-menerus" ini secara total mengubah logika penetapan harga hardware.
Inferensi agen jangka panjang, apa manfaatnya?
🥇 HBM
KV Cache yang mengikuti jumlah putaran dialog dan panjang konteks meningkat secara linier, cepat kehabisan kapasitas HBM GPU. Setelah KV Cache keluar dari GPU, bandwidth turun dari tingkat TB/s ke ratusan GB/s—masalah berubah dari "kekuatan komputasi" menjadi "lebar pita memori".
Tiga produsen utama kehabisan kapasitas, kekurangan 50%-60%, pasar tahun 2026 diperkirakan mencapai 54,6 miliar dolar.
🥈 Chip optik/InP
Inferensi jangka panjang berjalan di cluster, setiap siklus membutuhkan sinkronisasi antar kartu. Semakin panjang tugas, semakin banyak siklus, semakin besar volume komunikasi.
Pasar modul optik tahun 2026 diperkirakan mencapai 26 miliar dolar, pertumbuhan tahunan 60%. Kekurangan substrat InP lebih dari 70%, harga indium naik 90% dibanding tahun lalu.
🥉 CPU
Tugas jangka panjang membutuhkan pemecahan tugas berkelanjutan, pemanggilan alat, manajemen proses, penjadwalan KV Cache. Hal-hal ini tidak bisa dilakukan GPU dengan baik, harus mengandalkan CPU.
Proporsi CPU/GPU dari 1:8 mendekati 1:1, CEO Intel secara terbuka mengatakan "beberapa CEO perusahaan menelepon menekan pengiriman CPU".
❄️ Pendinginan cairan
Inferensi singkat adalah beban pulsa, inferensi panjang adalah beban penuh terus-menerus. Dengan kartu yang sama, konsumsi energi nyata dari tugas panjang 3-5 kali lipat dari inferensi singkat.
Daya kabinet melonjak dari 36kW ke 200kW, pendinginan udara tidak mampu, pendinginan cairan dari "opsional" menjadi "wajib".
🔌 Switch
Kebutuhan bandwidth cluster inferensi dari 100G melonjak ke 400G, puluhan ribu kartu perlu dijadwalkan. IB dan Ethernet berkecepatan tinggi mendapatkan manfaat penuh.
📦 Papan ABF
Cluster dari ribuan kartu menjadi puluhan ribu kartu, setiap chip harus dipaketkan. Mitsui Monopolize 90%+ dari film ABF, kekurangan 42% pada tahun 2028.
Harga tepung naik, roti akan semakin mahal.
🧪 CCL M9
Motherboard dan backplane cluster inferensi semuanya membutuhkan bahan dasar berkecepatan tinggi. Harga M9 sepuluh kali lipat dari FR4 biasa, pasar AI CCL tahun 2027 diperkirakan mencapai 18,7 miliar dolar, pertumbuhan melebihi modul optik.
OpenClaw menyalakan api, GLM-5.2 menyediakan kayunya.
Yang pertama membuat perusahaan model meraih keuntungan Token pertama, yang kedua membawa pasar ini dari laboratorium ke industri.
Operasi sederhana masih berdiri di penyimpanan, di cahaya, menikmati gelembung AI.
$MU $SKHYNIX $LITE

TOKEN2,17%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
gStocksTokenizedStocksLive
4,5M Popularitas
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,04M Popularitas
#
IsraelStrikesIranBTCPlunges
67,91K Popularitas
#
PredictWorldCupShare20000U
143,31K Popularitas
#
ETHBreaks1700
152,55M Popularitas

Disematkan

peta situs

OpenClaw membuat perusahaan model pertama kali merasakan manisnya ekonomi Token.

Topik Trending

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Disematkan