Microsoft випустила першу модель інтелектуального агента для управління комп’ютером з 7 мільярдами параметрів Fara-7B

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 16 травня (UTC+8), Microsoft випустила Fara-7B — це її перша 7-модельна мовна модель з параметрами, спеціально розроблена для сценаріїв використання на комп’ютерах. Ця модель використовує архітектуру мультимодального декодера, здатна приймати знімки екрана та текстовий контекст, безпосередньо прогнозуючи параметризовані ланцюги мислення та операційні дії. Побудована на основі Qwen 2.5-VL (7B), підтримує довжину контексту 128 тисяч, тренувалася протягом 2,5 днів на 64 GPU H100, випущена під ліцензією MIT 24 листопада 2025 року. Fara-7B через знімки екрана сприймає введення браузера, поєднуючи внутрішнє мислення та історію станів для прогнозування наступних дій та параметрів (наприклад, координат кліку), тренування базується на масштабному повністю синтезованому наборі даних. Модель здатна планувати та виконувати складні завдання (наприклад, бронювання ресторану, подача заявки на роботу, планування подорожі тощо). У сфері безпеки та узгодженості застосовуються методи стабільного додаткового навчання, модель має здатність розпізнавати ключові точки, відмовлятися від семи типів завдань, що порушують політику використання, та зупиняти операції при введенні особистої інформації або завершенні покупки. Користувачі можуть розгортати та взаємодіяти через репозиторій GitHub, vllm та інструмент fara-cli, основне застосування — автоматизація веб-завдань. (Джерело: InFoQ)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 10
  • 3
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
GateUser-16838403
· 9хв. тому
2.5-денний тренувальний цикл, така ефективність у Майкрософт трохи лякає
Переглянути оригіналвідповісти на0
GateUser-53a6e1a8
· 4год тому
Безпечне вирівнювання може відмовитися виконувати порушуючі завдання, і в цьому воно надійніше за AutoGPT
Переглянути оригіналвідповісти на0
TheBluePeony'sProphecy
· 4год тому
Qwen 2.5-VL має хорошу базу, але у багатомодальному агентському напрямку все шалено змагаються
Переглянути оригіналвідповісти на0
SeaSaltFlavorAirdrop
· 4год тому
У сфері автоматизації веб-сторінок, злиття Playwright+LLM може призвести до втрати роботи для тих, хто займається ручним налаштуванням.
Переглянути оригіналвідповісти на0
GateUser-4bd1cc87
· 4год тому
Позитивний відгук про ліцензію MIT, 7B параметрів тепер можна запускати локально
Переглянути оригіналвідповісти на0
GlassCityAfterTheRain
· 4год тому
fara-cli розгортання просте? Чи є Docker-образ?
Переглянути оригіналвідповісти на0
GateUser-8da82d63
· 4год тому
Повністю синтезовані дані для навчання, здатність до узагальнення під питанням, очікується реальне тестування
Переглянути оригіналвідповісти на0
LateAlphaCourier
· 4год тому
128k контексту достатньо, щоб я міг вставити всю веб-сторінку.
Переглянути оригіналвідповісти на0
AirdropUnderTheNeonBridge
· 4год тому
Скріншот+текст безпосередньо прогнозують координати, автоматизація браузера має змінитися
Переглянути оригіналвідповісти на0
CandleChaser
· 4год тому
64 карт H100 тренувалися два з половиною дні, я не можу підрахувати ціну.
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріплено