Zhipu AI merilis model pengkodean visual GLM-5V-Turbo

robot
Pembuatan abstrak sedang berlangsung

Berita ME: Pada 2 April (UTC+8), Zhipu AI baru-baru ini merilis model dasar generasi baru GLM-5V-Turbo. Model ini bertujuan untuk menjembatani kesenjangan antara persepsi visual dan rekayasa perangkat lunak. Berbeda dengan model bahasa besar standar yang hanya bergantung pada prompt teks, GLM-5V-Turbo secara asli mendukung pemrosesan input visual seperti desain rancangan dan tangkapan layar, dan diposisikan sebagai “model pengkodean visual”. Menurut pandangan dalam artikel, model ini memiliki kemampuan pengkodean multimodal asli yang dapat memahami berbagai jenis input seperti gambar, video, desain rancangan, dan tata letak dokumen, serta dalam hal keseimbangan kemampuan visual dan pemrograman, meraih performa terdepan pada pengujian benchmark inti. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan