Évaluation par des tiers publiée : le nouveau modèle de Thinking Machines s'associe à GPT-Realtime-2, en tête des classements audio

Selon la surveillance de Dongcha Beating, la plateforme de données Scale Labs a annoncé les dernières classements Audio MC S2S. Les résultats de l’évaluation montrent que le nouveau modèle TML-Interaction-Small de Thinking Machines a obtenu un score APR de 43,4 %, se classant à égalité pour la première place avec GPT-Realtime-2 (xHigh) d’OpenAI. En termes de scores spécifiques, GPT-Realtime-2 (xHigh) détient le score absolu avec 48,45 points, suivi de près par TML-Interaction-Small avec 43,36 points. Étant donné que la différence de score se situe dans la marge d’erreur statistique, les deux modèles sont officiellement classés ex æquo pour la première place. La deuxième tierce comprend la version standard de GPT-Realtime-2 (37,61 points), le mode de pensée activé Gemini 3.1 Flash Live (36,06 points), et l’ancien GPT-Realtime-1.5. Scale Labs a noté que ce modèle démontre une capacité rare de conscience du contexte long parmi les modèles duplex complets existants tout en maintenant une vitesse de réponse rapide dans les conversations.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler