Microsoft выпустила первый модель интеллектуального агента с управлением компьютером на 7 миллиардов параметров Fara-7B

robot
Генерация тезисов в процессе
AIMPACT сообщение, 16 мая (UTC+8), Microsoft выпустила Fara-7B, это их первый специализированный малый языковой модель с 7 миллиардами параметров, разработанный специально для сценариев использования в вычислительных задачах. Эта модель использует мультимодальную декодерную архитектуру, способную принимать скриншоты изображений и текстовый контекст, прямо предсказывая цепочки мышления с параметрами и операционные действия. Построена на базе Qwen 2.5-VL (7B), поддерживает длину контекста 128k, обучалась 2,5 дня на 64 GPU H100, выпущена под лицензией MIT 24 ноября 2025 года. Fara-7B воспринимает браузерный ввод через скриншоты, объединяя внутренние рассуждения и исторические записи состояния для предсказания следующего действия и параметров (например, координат клика), обучение основано на масштабном полностью синтезированном наборе данных. Модель способна планировать и выполнять сложные задачи (например, бронирование ресторана, подача заявки на работу, планирование путешествия и т.д.). В области безопасности и выравнивания использован устойчивый метод дообучения, обладающий способностью распознавать ключевые точки, отказываться от семи типов задач, нарушающих политику использования, и при вводе личной информации или завершении покупки приостанавливать операции на ключевых точках остановки. Пользователи могут развернуть и взаимодействовать через репозиторий GitHub, vllm и инструмент fara-cli, основное применение — автоматизация веб-задач. (Источник: InFoQ)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • 3
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
MintConditionHuman
· 3ч назад
Автоматизация браузера становится всё более конкурентной, после AutoGPT появился ещё один достойный соперник
Посмотреть ОригиналОтветить0
BlocktimeBarista
· 3ч назад
Предсказание координат — это довольно важно, раньше многие модели точно определяли расположение элементов впечатляюще.
Посмотреть ОригиналОтветить0
RugCheckSkeptic
· 3ч назад
Обучение на полностью синтезированных данных — не приведет ли это к сбоям при применении к реальным сложным страницам?
Посмотреть ОригиналОтветить0
QuietValidator
· 3ч назад
Высокая оценка лицензии MIT, наконец-то не нужно смотреть на эти коммерческие ограничения
Посмотреть ОригиналОтветить0
ColdWalletUnderTheNeonLights
· 3ч назад
fara-cli部署体验如何?有试过的兄弟说说踩坑没
Посмотреть ОригиналОтветить0
LateBlockLarry
· 3ч назад
64 блоков H100 тренируются 2,5 дня, эта эффективность впечатляет, синтетические данные делают большую работу
Посмотреть ОригиналОтветить0
  • Закреплено