Zhipu AI lanza el modelo de codificación visual GLM-5V-Turbo

MeNews · 2026-04-02T01:03:20+00:00

Zhipu AI lanza la nueva generación de modelos básicos GLM-5V-Turbo, que admite entradas visuales como diseños y capturas de pantalla, con capacidad de codificación multimodal, logrando un equilibrio entre habilidades visuales y de programación, y mostrando un rendimiento sobresaliente en las pruebas de referencia clave.

MeNews

2026-04-02 01:03:20

Generación de resúmenes en curso

Noticias de ME News, 2 de abril (UTC+8). Zhipu AI ha lanzado recientemente su nuevo modelo base de próxima generación, GLM-5V-Turbo. El modelo tiene como objetivo cerrar la brecha entre la percepción visual y la ingeniería de software. A diferencia de los modelos de lenguaje grandes estándar que solo dependen de indicaciones de texto, GLM-5V-Turbo admite de forma nativa el procesamiento de entradas visuales como borradores de diseño y capturas de pantalla, y se presenta como un “modelo de codificación visual”. Según la opinión expresada en el artículo, el modelo cuenta con una capacidad nativa de codificación multimodal, capaz de comprender diversas entradas como imágenes, videos, borradores de diseño y la disposición de documentos; y, en términos del equilibrio entre capacidades visuales y de programación, logró un rendimiento líder en las principales pruebas de referencia. (Fuente: InFoQ)

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

2 me gusta