Microsoft finalmente se lanza a crear un agente inteligente de 7 mil millones, Fara-7B que directamente mira imágenes, opera y navega en el navegador, MIT open source, es bastante interesante

Ver original
MeNews
Microsoft lanza el primer modelo de agente inteligente controlado por computadora con 7 mil millones de parámetros, Fara-7B
AIMPACT Mensaje, 16 de mayo (UTC+8), Microsoft lanzó Fara-7B, su primer modelo de lenguaje inteligente de 7B parámetros diseñado específicamente para escenarios de uso en computadoras. El modelo utiliza una arquitectura de decodificador multimodal, capaz de recibir imágenes de capturas de pantalla y contexto de texto, y predecir directamente cadenas de pensamiento con parámetros y acciones operativas. Construido sobre Qwen 2.5-VL (7B), soporta una longitud de contexto de 128k, entrenado durante 2.5 días en 64 GPU H100, y lanzado bajo la licencia MIT el 24 de noviembre de 2025. Fara-7B percibe la entrada del navegador mediante capturas de pantalla, combinando razonamiento interno y registro del estado histórico para predecir la siguiente acción y sus parámetros (como coordenadas de clic), el entrenamiento depende de un conjunto de datos sintéticos a gran escala. El modelo puede planificar y ejecutar tareas avanzadas (como reservar un restaurante, solicitar un empleo, planificar
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado