智谱AI发布视觉编码模型GLM-5V-Turbo

MeNews · 2026-04-11T06:10:40+00:00

智谱AI выпустила новое поколение базовой модели GLM-5V-Turbo, поддерживающей визуальный ввод, такой как дизайн-макеты и скриншоты, обладающей мультимодальной кодировочной способностью, достигая баланса между визуальными и программными возможностями, и демонстрирующей отличные результаты в основных бенчмарках.

MeNews

2026-04-11 06:10:40

Генерация тезисов в процессе

ME News Новости, 2 апреля (UTC+8), Zhipu AI недавно выпустила новое поколение базовых моделей GLM-5V-Turbo, которая предназначена для устранения разрыва между визуальным восприятием и программной инженерией. В отличие от стандартных больших языковых моделей, основанных только на текстовых подсказках, GLM-5V-Turbo изначально поддерживает обработку визуальных входных данных, таких как проектные чертежи, скриншоты и т. д., и позиционируется как “модель визуального кодирования”. Согласно статье, эта модель обладает нативной мультимодальной способностью кодирования, способна понимать изображения, видео, проектные чертежи и макеты документов, а также показывает передовые результаты в балансировании визуальных и программных возможностей в основных бенчмарках. (Источник: InFoQ)

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

1 Лайков