智谱AI发布视觉编码模型GLM-5V-Turbo

robot
Генерация тезисов в процессе

ME News Новости, 2 апреля (UTC+8), Zhipu AI недавно выпустила новое поколение базовых моделей GLM-5V-Turbo, которая предназначена для устранения разрыва между визуальным восприятием и программной инженерией. В отличие от стандартных больших языковых моделей, основанных только на текстовых подсказках, GLM-5V-Turbo изначально поддерживает обработку визуальных входных данных, таких как проектные чертежи, скриншоты и т. д., и позиционируется как “модель визуального кодирования”. Согласно статье, эта модель обладает нативной мультимодальной способностью кодирования, способна понимать изображения, видео, проектные чертежи и макеты документов, а также показывает передовые результаты в балансировании визуальных и программных возможностей в основных бенчмарках. (Источник: InFoQ)

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить