Epoch AI Research evalúa el rendimiento del nuevo modelo de Meta Muse Spark en el estándar FrontierMath

robot
Generación de resúmenes en curso

ME News Noticias, 9 de abril (UTC+8), Epoch AI Research recientemente obtuvo acceso previo a la versión de prueba del nuevo modelo de Meta, Muse Spark, y lo evaluó en el benchmark FrontierMath. Los resultados de la evaluación muestran que Muse Spark obtuvo una puntuación del 39% en Tier 1-3 y del 15% en Tier 4. Según el artículo, este rendimiento es competitivo en comparación con varios modelos de vanguardia recientes, pero queda por detrás de GPT-5.4. (Fuente: InFoQ)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado