Zhipu AI Meluncurkan API Kecepatan Tinggi GLM-5.1 dengan 400 Token per Detik

Zhipu AI meluncurkan API Kecepatan Tinggi GLM-5.1 untuk pelanggan perusahaan tertentu, dengan kecepatan output mencapai 400 token per detik. Zhipu AI mengatakan layanan ini menggunakan mesin inferensi yang dikembangkan bersama dengan TileRT dan akan terus menambahkan inferensi FP8 serta dukungan konteks ultra-panjang.
ZHIPU26,55%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan