Microsoft выпустила первый модель интеллектуального агента с управлением компьютером на 7 миллиардов параметров Fara-7B

robot
Генерация тезисов в процессе
AIMPACT сообщение, 16 мая (UTC+8), Microsoft выпустила Fara-7B, это их первый специализированный малый языковой модель с 7 миллиардами параметров, разработанная специально для сценариев использования в компьютерах. Эта модель использует мультимодальную декодерную архитектуру, способную принимать скриншоты изображений и текстовый контекст, прямо предсказывая цепочки мышления с параметрами и операционные действия. Построена на базе Qwen 2.5-VL (7B), поддерживает длину контекста 128k, обучалась 2,5 дня на 64 GPU H100, выпущена под лицензией MIT 24 ноября 2025 года. Fara-7B воспринимает браузерный ввод через скриншоты, сочетая внутреннее рассуждение и запись исторического состояния для предсказания следующего действия и параметров (например, координат клика), обучение основано на масштабном полностью синтезированном наборе данных. Модель способна планировать и выполнять сложные задачи (например, бронирование ресторана, подача заявки на работу, планирование путешествия и т.д.). В области безопасности и согласованности применяется метод устойчивого последующего обучения, модель обладает способностью распознавать ключевые точки, отказываться от семи типов задач, нарушающих политику использования, и при вводе личной информации или завершении покупки останавливать операции на ключевых точках. Пользователи могут развернуть и взаимодействовать через репозиторий GitHub, vllm и инструмент fara-cli, основное применение — автоматизация веб-задач. (Источник: InFoQ)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • 3
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
AirdropNightwatch
· 5ч назад
В области автоматизации браузера кажется, что придется напрямую конкурировать с Browser-use и Computer-use.
Посмотреть ОригиналОтветить0
MintCondition
· 6ч назад
Автоматизация задач на веб-страницах, наконец-то больше не нужно писать кучу селекторов
Посмотреть ОригиналОтветить0
SaveABitOnGasFees
· 6ч назад
После обучения на сколько процентов данных было использовано для выравнивания? Скоро опубликуют статью.
Посмотреть ОригиналОтветить0
GateUser-83c80dd0
· 6ч назад
7B параметров для планирования агента, легкий, но границы возможностей требуют реальных тестов
Посмотреть ОригиналОтветить0
GateUser-bee672a5
· 6ч назад
fara-cli развертывание опыт ожидает тестирования, надеюсь, не будет как у некоторых проектов с плохой документацией
Посмотреть ОригиналОтветить0
Half-SectionSucculent
· 6ч назад
Координатное прогнозирование + цепочка мышления, тонкое управление гораздо сильнее, чем чистый текстовый API
Посмотреть ОригиналОтветить0
0xLateCoffee
· 6ч назад
128k контекст + восприятие по скриншотам, эта комбинация что-то даёт
Посмотреть ОригиналОтветить0
CandleChaser
· 6ч назад
Высокая оценка лицензии MIT, 7B теперь может работать локально
Посмотреть ОригиналОтветить0
  • Закреплено