Tinygrad menyatakan bahwa GLM5.2 dapat mencapai 120 tok/detik dalam konfigurasi Blackwell yang terhubung dua mesin, dengan harga 150.000 dolar AS

robot
Pembuatan abstrak sedang berlangsung

BlockBeats Berita, 21 Juni, penjual GPU Tinygrad mengumumkan bahwa, berdasarkan informasi terpercaya, model GLM 5.2 dapat melakukan inferensi dengan kecepatan 120 token per detik di dua mesin Blackwell yang terhubung jaringan dengan arsitektur tinybox.

Konfigurasi ini dijual seharga 150.000 dolar AS, dengan pilihan dua tinybox standar atau satu tinybox Pro, keduanya dapat mencapai kinerja di atas. Tinygrad menggunakan ini sebagai poin jual, menonjolkan jalur penyebaran privat "beli sekali, tidak pernah bayar biaya cloud" yang menargetkan penyebaran privat, langsung bersaing dengan layanan inferensi cloud berbasis biaya sesuai permintaan.

Saat ini, berita ini belum dikonfirmasi secara resmi oleh GLM, dan Tinygrad juga belum mengungkapkan detail teknis lebih lanjut.


Klik tautan asli di bawah untuk bergabung dengan saluran berita AI Beating · Feishu, yang memantau hotspot dan berita AI global 24/7 tanpa henti.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan