Microsoft наконец-то запустила 7B интеллектуальную систему, Fara-7B напрямую работает с изображениями, управляет браузером, MIT выпустила открытый исходный код — это интересно

Посмотреть Оригинал
MeNews
Microsoft выпустила первый модель интеллектуального агента с управлением компьютером на 7 миллиардов параметров Fara-7B
AIMPACT сообщение, 16 мая (UTC+8), Microsoft выпустила Fara-7B, это их первый специализированный для сценариев использования компьютеров интеллектуальный малый языковой модель с 7 миллиардами параметров. Эта модель использует мультимодальную декодерную архитектуру, способную принимать скриншоты изображений и текстовый контекст, напрямую предсказывая цепочки мышления с параметрами и операционные действия. Построена на базе Qwen 2.5-VL (7B), поддерживает длину контекста 128k, обучалась 2,5 дня на 64 GPU H100, выпущена под лицензией MIT 24 ноября 2025 года. Fara-7B воспринимает браузерный ввод через скриншоты, сочетая внутренние рассуждения и запись исторического состояния для предсказания следующего действия и параметров (например, координат клика), обучение основано на масштабном полностью синтезированном наборе данных. Модель способна планировать и выполнять сложные задачи (например, бронирование ресторана, подача заявки на работу, планирование
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено