Evaluación de terceros publicada: El nuevo modelo de Thinking Machines se vincula con GPT-Realtime-2, y encabeza las clasificaciones de audio

Según el monitoreo de Dongcha Beating, la plataforma de datos Scale Labs ha anunciado las últimas clasificaciones de Audio MC S2S. Los resultados de la evaluación muestran que el modelo TML-Interaction-Small, recientemente lanzado por Thinking Machines, logró una puntuación APR del 43,4%, empatando en primer lugar con GPT-Realtime-2 (xHigh) de OpenAI. En términos de puntuaciones específicas, GPT-Realtime-2 (xHigh) ocupa la puntuación absoluta más alta con 48,45 puntos, seguido de cerca por TML-Interaction-Small con 43,36 puntos. Dado que la diferencia de puntuación se encuentra dentro del margen de error estadístico, ambos modelos están oficialmente clasificados como empatados en primer lugar. La segunda categoría sigue con la versión estándar de GPT-Realtime-2 (37,61 puntos), el modo de pensamiento habilitado Gemini 3.1 Flash Live (36,06 puntos), y el GPT-Realtime-1.5 más antiguo. Scale Labs señaló que este modelo demuestra una capacidad rara de conciencia de contexto largo entre los modelos de doble vía existentes, mientras mantiene una velocidad de respuesta rápida en las conversaciones.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado