UnslothAI merilis versi DGEMMA 4-31B MLX 4-bit yang dioptimalkan untuk Apple Silicon

robot
Pembuatan abstrak sedang berlangsung

ME News Berita, 11 April (UTC+8), UnslothAI baru-baru ini merilis versi optimisasi MLX 4-bit asli dari model DGEMMA 4-31B.
Versi ini dirancang khusus untuk Apple Silicon, diklaim dapat mencapai kecepatan inferensi yang sangat cepat di semua Mac seri M, sambil mempertahankan penggunaan memori yang efisien (sekitar 20GB RAM).
Selain itu, model ini juga memiliki performa multimodal dan visual yang kuat, mendukung panjang konteks lengkap 256K serta fungsi panggilan asli. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan