Microsoft выпустила Fara-7B, мультимодальный агент с 7 миллиардами параметров, специально разработанный для сценариев использования на компьютерах. Может одновременно обрабатывать скриншоты и текст, напрямую предсказывать цепочки мышления с параметрами и операционные действия, основан на Qwen 2.5-VL, с контекстом 128k, обучен за 2,5 дня на 64 блоках H100, выпущен под лицензией MIT. Он воспринимает ввод браузера через скриншоты, сочетает рассуждения и прогнозирование исторического состояния для определения следующего действия и параметров, таких как координаты, основываясь на масштабных полностью синтезированных данных. Обладает способностью планировать и выполнять сложные задачи, использует устойчивое последующее обучение для безопасного выравнивания, умеет отклонять нарушающие правила задачи и приостанавливаться в ключевых точках. Может быть развернут и взаимодействовать через GitHub, vllm, fara-cli, используется для автоматизации веб-страничных задач.

MeNews

2026-05-27 04:06:37

Генерация тезисов в процессе

AIMPACT сообщение, 16 мая (UTC+8), Microsoft выпустила Fara-7B, это их первый специализированный малый языковой модель с 7 миллиардами параметров, разработанная специально для сценариев использования в компьютерах. Эта модель использует мультимодальную декодерную архитектуру, способную принимать скриншоты изображений и текстовый контекст, прямо предсказывая цепочки мышления с параметрами и операционные действия. Построена на базе Qwen 2.5-VL (7B), поддерживает длину контекста 128k, обучалась 2,5 дня на 64 GPU H100, выпущена под лицензией MIT 24 ноября 2025 года. Fara-7B воспринимает браузерный ввод через скриншоты, сочетая внутреннее рассуждение и запись исторического состояния для предсказания следующего действия и параметров (например, координат клика), обучение основано на масштабном полностью синтезированном наборе данных. Модель способна планировать и выполнять сложные задачи (например, бронирование ресторана, подача заявки на работу, планирование путешествия и т.д.). В области безопасности и согласованности применяется метод устойчивого последующего обучения, модель обладает способностью распознавать ключевые точки, отказываться от семи типов задач, нарушающих политику использования, и при вводе личной информации или завершении покупки останавливать операции на ключевых точках. Пользователи могут развернуть и взаимодействовать через репозиторий GitHub, vllm и инструмент fara-cli, основное применение — автоматизация веб-задач. (Источник: InFoQ)

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

11 Лайков

Награда
11
9
3
Поделиться

комментарий

Добавить комментарий

GateUser-53a6e1a8

· 3ч назад

Безопасное выравнивание может отклонить неправомерные задачи, и в этом оно надежнее, чем AutoGPT.

Посмотреть ОригиналОтветить0

TheBluePeony'sProphecy

· 3ч назад

Qwen 2.5-VL основание хорошее, но в многомодальном агентском сегменте всё очень напряжённо

Посмотреть ОригиналОтветить0

SeaSaltFlavorAirdrop

· 3ч назад

В области автоматизации веб-страниц, любители «зашитых» решений с Playwright+LLM могут остаться без работы

Посмотреть ОригиналОтветить0

GateUser-4bd1cc87

· 3ч назад

Положительный отзыв о лицензии MIT, 7B параметров теперь можно запускать локально

Посмотреть ОригиналОтветить0

GlassCityAfterTheRain

· 3ч назад

fara-cli развертывание простое? Есть ли Docker-образ?

Посмотреть ОригиналОтветить0

GateUser-8da82d63

· 3ч назад

Обучение на полностью синтетических данных, сомнения в способности к обобщению, ожидаются реальные испытания

Посмотреть ОригиналОтветить0

LateAlphaCourier

· 3ч назад

128k контекста достаточно, чтобы я поместил всю страницу целиком.

Посмотреть ОригиналОтветить0

AirdropUnderTheNeonBridge

· 3ч назад

Скриншот + текст напрямую предсказывают координаты, автоматизация браузера должна измениться

Посмотреть ОригиналОтветить0

CandleChaser

· 3ч назад

64 карт H100 обучались два с половиной дня, я не могу посчитать эти затраты

Посмотреть ОригиналОтветить0

Подробнее

Популярные темы
Подробнее
#
StockTradingChallengeUpTo17000U
16.23M Популярность
#
TrumpBacksCFTCAuthorityOverPredictionMarkets
818.01K Популярность
#
IsraelStrikesIranBTCPlunges
49.57K Популярность
#
GatePredictionMarketAddsSmartMoneyTracking
13.77M Популярность
#
MicronMarketCapBreaks1Trillion
37.03K Популярность

Закреплено

Карта сайта

Microsoft выпустила первый модель интеллектуального агента с управлением компьютером на 7 миллиардов параметров Fara-7B

Популярные темы

StockTradingChallengeUpTo17000U

TrumpBacksCFTCAuthorityOverPredictionMarkets

IsraelStrikesIranBTCPlunges

GatePredictionMarketAddsSmartMoneyTracking

MicronMarketCapBreaks1Trillion

Закреплено