L'ancien CTO d'OpenAI défie son ancien employeur : un nouveau modèle répond en 200 ms, surpassant GPT-Realtime en termes de latence

Selon le suivi Beating, le laboratoire Thinking Machines fondé par l’ancien CTO d’OpenAI Mira Murati a publié un aperçu de recherche sur le « modèle interactif ». Le nouveau système abandonne la méthode traditionnelle consistant à assembler la voix et le texte à l’aide d’outils externes, traitant nativement l’interaction audio-vidéo en temps réel. Le modèle peut recevoir des informations en continu avec une « micro-réponse » de 200 ms, permettant d’écouter, de voir et de parler simultanément, tout en supportant les interruptions en temps réel par l’utilisateur.

Le premier modèle présenté, TML-Interaction-Small, utilise une architecture MoE de 276 milliards de paramètres, activant 12 milliards de paramètres à chaque fois. Afin de remédier à la limitation des grands modèles traditionnels qui « cessent de percevoir lors de la génération de réponses », l’équipe de développement a divisé le système en une partie frontale et une partie arrière : le modèle frontal maintient une conversation ininterrompue, tandis que le modèle arrière traite en synchronisation des inférences complexes, des recherches web ou la génération d’UI, puis renvoie les résultats de manière fluide au frontal.

Cette architecture surpasse directement ses concurrents en termes de vitesse de réponse. Selon les données officielles, la latence de rotation vocale n’est que de 0,40 seconde, et il a obtenu 77,8 points dans le FD-bench V1.5, deux indicateurs clés étant supérieurs à GPT-realtime-2.0 et Gemini 3.1 Flash Live. Cependant, le traitement continu de l’audio et de la vidéo consomme rapidement la capacité de contexte, et l’effet de faible latence dépend fortement de la qualité du réseau. Thinking Machines prévoit d’ouvrir une prévisualisation limitée dans les prochains mois.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler