Microsoft випустила першу модель інтелектуального агента для управління комп’ютером з 7 мільярдами параметрів Fara-7B

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 16 травня (UTC+8), Microsoft випустила Fara-7B, це її перша 7B параметрична інтелектуальна модель, спеціально розроблена для сценаріїв використання на комп’ютерах. Ця модель використовує архітектуру мультимодального декодера, здатна приймати знімки екрана та текстовий контекст, безпосередньо прогнозуючи параметризовані ланцюги мислення та операційні дії. Побудована на основі Qwen 2.5-VL (7B), підтримує довжину контексту 128k, тренувалася протягом 2.5 днів на 64 GPU H100, випущена під ліцензією MIT 24 листопада 2025 року. Fara-7B через знімки екрана сприймає введення з браузера, поєднуючи внутрішнє мислення та історію станів для прогнозування наступних дій та параметрів (наприклад, координат кліку), тренування базується на масштабному повністю синтезованому наборі даних. Модель здатна планувати та виконувати складні завдання (наприклад, бронювання ресторану, подача заявки на роботу, планування подорожі тощо). У сфері безпеки та узгодженості застосовуються методи стабільного додаткового навчання, модель має здатність розпізнавати ключові точки, відмовлятися від семи типів завдань, що порушують політику використання, та зупиняти операції при введенні особистої інформації або завершенні покупки. Користувачі можуть розгортати та взаємодіяти через репозиторій GitHub, vllm та інструмент fara-cli, основне застосування — автоматизація веб-завдань. (Джерело: InFoQ)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • 3
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
AirdropNightwatch
· 5год тому
Що стосується автоматизації браузера, здається, доведеться боротися з Browser-use та Computer-use напряму.
Переглянути оригіналвідповісти на0
MintCondition
· 6год тому
Автоматизація веб-завдань, нарешті більше не потрібно писати купу селекторів
Переглянути оригіналвідповісти на0
SaveABitOnGasFees
· 6год тому
Скільки відсотків даних було використано для пост-тренувального вирівнювання? Скоро опублікують статтю.
Переглянути оригіналвідповісти на0
GateUser-83c80dd0
· 6год тому
7B параметрів для планування агента, легкий, але межі можливостей потрібно перевірити на практиці
Переглянути оригіналвідповісти на0
GateUser-bee672a5
· 6год тому
fara-cli розгортання досі в процесі тестування, сподіваюся, не буде як у деяких проектах з поганою документацією
Переглянути оригіналвідповісти на0
Half-SectionSucculent
· 6год тому
Координатне прогнозування + ланцюг мислення, тонкий контроль набагато сильніший за чистий текстовий API
Переглянути оригіналвідповісти на0
0xLateCoffee
· 6год тому
128k контексту + сприйняття скріншотів, ця комбінація має потенціал
Переглянути оригіналвідповісти на0
CandleChaser
· 6год тому
Похвала за ліцензію MIT, 7B може запускатися локально
Переглянути оригіналвідповісти на0
  • Закріплено