SOOHAK est une référence mathématique en intelligence artificielle créée par l'alliance des mathématiciens 64 bits, comprenant 439 tâches manuscrites, dont 99 ont été délibérément conçues comme insolubles. Des études montrent que Google Gemini 3 Pro atteint environ 30 % de précision sur des problèmes de niveau recherche, mais aucun modèle ne dépasse 50 % pour identifier les tâches insolubles. Augmenter les ressources de calcul peut améliorer la capacité de résolution, mais il est difficile d'améliorer la capacité à reconnaître l'insolubilité. SOOHAK vise à quantifier l'écart entre les quelques points forts de l'IA et le déficit systématique en compétences de recherche.

MeNews

2026-05-17 11:20:34

Création du résumé en cours

AIMPACT message, le 17 mai (UTC+8), le nouveau test de référence mathématique IA SOOHAK, créé par l’alliance de 64 mathématiciens, révèle des défauts clés des modèles d’IA.
Ce test comprend 439 tâches manuscrites, dont 99 ont été délibérément conçues comme insolubles.
Google Gemini 3 Pro domine sur des problèmes de niveau recherche, atteignant une précision de 30 %, mais aucun modèle ne dépasse 50 % dans la reconnaissance des tâches sans solution.
Il a été constaté que davantage de ressources de calcul peuvent améliorer la capacité des modèles à résoudre des problèmes, mais ne renforcent pas leur capacité à reconnaître l’absence de solution.
SOOHAK vise à quantifier l’écart entre les quelques résultats remarquables de l’IA et les compétences de recherche encore largement manquantes dans le système.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateSquareMayTradingShare
1.96M Popularité
#
CLARITYActPassesSenateCommittee
3.59M Popularité
#
IsraelStrikesIranBTCPlunges
47.35K Popularité
#
#DailyPolymarketHotspot
978.87K Popularité
#
BitcoinVShapedReversalBack
227.15M Popularité

Épinglé

L’évaluation de référence SOOHAK révèle des défauts des modèles d’IA : leur capacité à identifier des problèmes mathématiques sans solution ne dépasse pas 50 %.

Sujets populaires

GateSquareMayTradingShare

CLARITYActPassesSenateCommittee

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

BitcoinVShapedReversalBack

Épinglé