智譜 випустила нативний мультимодальний кодинг-модель GLM-5V-Turbo, глибоко адаптовану до OpenClaw

robot
Генерація анотацій у процесі

Сіньхуа Технології, 4 квітня — повідомляє, що Zhipu випустила першу нативну мультимодальну модель Coding бази GLM-5V-Turbo, яка глибоко інтегрує візуальні та програмні можливості, здатна нативно обробляти текст, зображення, відео та іншу мультимодальну інформацію, одночасно добре справляється з програмуванням, довгостроковим плануванням, виконанням операцій та іншими складними завданнями.

Зазначається, що GLM-5V-Turbo демонструє провідні результати у ключових бенчмарках, таких як мультимодальне Coding та Agent, при менших розмірах, при цьому, додавання візуальних можливостей не знизило рівень чисто текстового програмування та логічних здатностей. Крім того, модель глибоко адаптована до сцен з Claude Code та Лобстер, що дозволило OpenClaw отримати справжні візуальні можливості та розуміти інформацію на екрані.

На відміну від традиційних моделей чистого текстового Coding, GLM-5V-Turbo може безпосередньо розуміти візуальні дані, такі як дизайн-макети, скріншоти веб-сторінок, графіки Кліна та генерувати робочий код, реалізуючи концепцію “бачиш — значить можеш”. Наразі ця модель вже доступна через платформу MaaS Zhipu. (Вень Мень)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити