Zhipu AI merilis model pengkodean visual GLM-5V-Turbo

MeNews · 2026-04-01T23:03:23+00:00

Zhipu AI merilis model dasar generasi baru GLM-5V-Turbo, mendukung input visual seperti desain dan tangkapan layar, memiliki kemampuan pengkodean multimodal, mencapai keseimbangan antara kemampuan visual dan pemrograman, dan menunjukkan performa yang unggul dalam pengujian standar inti.

MeNews

2026-04-01 23:03:23

Pembuatan abstrak sedang berlangsung

Berita ME: pada 2 April (UTC+8), Zhipu AI baru-baru ini merilis model dasar generasi berikutnya GLM-5V-Turbo. Model ini bertujuan untuk menjembatani kesenjangan antara persepsi visual dan rekayasa perangkat lunak. Berbeda dengan model bahasa besar standar yang hanya bergantung pada petunjuk berbasis teks, GLM-5V-Turbo secara native mendukung pemrosesan input visual seperti rancangan desain dan tangkapan layar, serta diposisikan sebagai “model pengodean visual”. Menurut pandangan dalam artikel tersebut, model ini memiliki kemampuan pengodean multimodal asli yang dapat memahami berbagai jenis input seperti gambar, video, rancangan desain, dan tata letak dokumen, serta dalam aspek keseimbangan kemampuan visual dan pemrograman, mencapai kinerja terdepan pada pengujian tolok ukur utama. (Sumber: InFoQ)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka