Zhipu AI lanza el modelo de codificación visual GLM-5V-Turbo

robot
Generación de resúmenes en curso

Noticias de ME: Mensaje, 2 de abril (UTC+8). Zhipu AI ha lanzado recientemente el nuevo modelo base de última generación GLM-5V-Turbo. Este modelo está diseñado para cerrar la brecha entre la percepción visual y la ingeniería de software. A diferencia de los modelos lingüísticos grandes estándar que solo dependen de indicaciones de texto, GLM-5V-Turbo admite de forma nativa el procesamiento de entradas visuales como bocetos de diseño y capturas de pantalla, y se posiciona como un “modelo de codificación visual”. Según el punto de vista del artículo, el modelo cuenta con capacidades nativas de codificación multimodal, capaz de comprender imágenes, videos, bocetos de diseño y la maquetación de documentos, entre otras entradas, y, en el equilibrio entre capacidades visuales y de programación, logró un rendimiento líder en las pruebas de referencia principales. (Fuente: InFoQ)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado