Microsoft lanza el primer modelo de agente inteligente controlado por computadora con 7 mil millones de parámetros, Fara-7B
Microsoft lanza Fara-7B, un agente inteligente multimodal de 7 mil millones de parámetros, diseñado específicamente para escenarios de uso en computadoras. Puede procesar capturas de pantalla y texto simultáneamente, predecir directamente cadenas de pensamiento y acciones operativas con parámetros, construido sobre Qwen 2.5-VL, con un contexto de 128k, entrenado en 64 bloques H100 durante 2.5 días, publicado bajo licencia MIT. A través de la percepción de capturas de pantalla, comprende las entradas del navegador, combina razonamiento y predicción del estado histórico para determinar la siguiente acción y parámetros como coordenadas, dependiendo de datos sintéticos a gran escala. Posee capacidad para planificar y ejecutar tareas avanzadas, y utiliza un alineamiento seguro robusto post-entrenamiento, pudiendo rechazar tareas inapropiadas y pausar en puntos clave. Se puede desplegar e interactuar mediante GitHub, vllm, fara-cli, para tareas automatizadas en páginas web.