Grok 4.20 Beta a obtenu un taux de précision de 97 % dans le test τ²-Bench, se classant en deuxième position

MeNews · 2026-04-09T19:28:48+00:00

ME News Actualités, le 5 avril (UTC+8), récemment, la version bêta 4.20 de Grok a obtenu un taux de précision de 97 % lors de l’évaluation τ²-Bench, se classant deuxième. τ²-Bench est une plateforme d’évaluation construite sur le cadre original τ-bench de Sierra, réputée pour sa rigueur. Cette évaluation ne teste pas seulement l’IA

MeNews

2026-04-09 19:28:48

Actualités ME, le 5 avril (UTC+8), récemment, la version bêta de Grok 4.20 Beta a obtenu un taux de précision de 97 % lors du test τ²-Bench, se classant deuxième. τ²-Bench est une évaluation construite sur le cadre original τ-bench de Sierra, connue pour sa rigueur. Cette évaluation teste non seulement la capacité de l’IA à répondre à des questions, mais aussi si l’agent intelligent peut réussir à accomplir des tâches de navigation. (Source : InFoQ)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

1 J'aime