AIMPACT Mensaje, 16 de mayo (UTC+8), Microsoft lanzó Fara-7B, su primer modelo de lenguaje inteligente de 7 mil millones de parámetros diseñado específicamente para escenarios de uso en computadoras.
El modelo utiliza una arquitectura de decodificador multimodal, capaz de recibir imágenes de capturas de pantalla y contexto de texto, prediciendo directamente cadenas de pensamiento parametrizadas y acciones operativas.
Construido sobre Qwen 2.5-VL (7B), soporta una longitud de contexto de 128k, entrenado durante 2.5 días en 64 GPU H100, y lanzado bajo licencia MIT el 24 de noviembre de 2025.
Fara-7B percibe entradas del navegador mediante capturas de pantalla, combinando razonamiento interno y registro del estado histórico para predecir la siguiente acción y sus parámetros (como coordenadas de clic), entrenado con un conjunto de datos sintéticos a gran escala.
El modelo puede planificar y ejecutar tareas avanzadas (como reservar restaurantes, solicitar empleos, planear viajes, etc.).
En cuanto a alineación de seguridad, utiliza métodos de entrenamiento posterior robusto, posee capacidad de reconocimiento de puntos clave, puede rechazar siete tipos de tareas que violen las políticas de uso, y en puntos críticos como ingresar información personal o completar compras, pausa la operación.
Los usuarios pueden desplegar e interactuar mediante repositorios en GitHub, vllm y la herramienta fara-cli, principalmente para tareas automatizadas en páginas web.
(Fuente: InFoQ)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

12 me gusta

Recompensa
12
5
Republicar
Compartir

Comentar

Añadir un comentario

Pragmatists

· hace3h

El parámetro es solo 7B, el costo de inferencia es controlable, y los equipos pequeños y medianos también pueden jugar.

Ver originalResponder0

ReflectionsOnTheStreetCorner

· hace6h

7B corredor de agente multimodal, alegría de los partidarios de la implementación local

Ver originalResponder0

YieldTuningFork

· hace6h

Microsoft ha llevado al máximo el patrón de código abierto, la licencia MIT es realmente atractiva

Ver originalResponder0

OracleSkeptic

· hace6h

El entrenamiento con datos sintéticos completos es interesante, y he entendido cómo funciona el ciclo cerrado de datos.

Ver originalResponder0

TheProphetOfToast

· hace6h

Construido sobre Qwen 2.5-VL, la base nacional ha progresado.

Ver originalResponder0

Temas de actualidad
Ver más
#
StockTradingChallengeUpTo17000U
16.22M Popularidad
#
USStrikesIran
9.32M Popularidad
#
IsraelStrikesIranBTCPlunges
49.53K Popularidad
#
GatePredictionMarketAddsSmartMoneyTracking
13.81M Popularidad
#
InstitutionalCapitalRotatesFromBTCToHYPEAndXRP
14.33M Popularidad

Fijado

Microsoft lanza el primer modelo de agente inteligente controlado por computadora con 7 mil millones de parámetros, Fara-7B

Temas de actualidad

StockTradingChallengeUpTo17000U

USStrikesIran

IsraelStrikesIranBTCPlunges

GatePredictionMarketAddsSmartMoneyTracking

InstitutionalCapitalRotatesFromBTCToHYPEAndXRP

Fijado