Selon le suivi Beating, Google DeepMind a publié un co-mathématicien IA, une plateforme de recherche interactive multi-agent destinée aux mathématiciens.
Ce système a obtenu un taux de réussite de 47,9 % (résolvant 23/48 problèmes) sur le benchmark mathématique de recherche le plus difficile actuellement, FrontierMath Tier 4, dépassant directement le record précédent de GPT-5.5 Pro à 39,6 %.
Ce système n’utilise pas la nouvelle génération de base, mais fonctionne directement avec Gemini 3.1 Pro.
Ce modèle seul, en mode brut, atteint seulement 19 % sur Tier 4, mais avec l’ajout du cadre d’agents, ses performances ont été multipliées.
DeepMind lui a construit une architecture à plusieurs couches : une « coordination de projet » au sommet divise la tâche de recherche en plusieurs flux de travail, qui sont ensuite distribués à des sous-agents chargés de la recherche documentaire, de l’écriture de code et de la raisonnement.
Les preuves générées doivent passer par une revue par plusieurs « agents de révision » lors d’une séance d’évaluation, et ne peuvent être soumises qu’après approbation.
Ce cadre lourd démontre que, pour la haute mathématique, la capacité d’orchestration peut produire un gain supérieur à celui d’un simple changement de modèle.
L’évaluation à l’aveugle a été menée par Epoch AI, et pour éviter la triche, l’équipe de DeepMind n’a pas vu les questions tout au long du processus, chaque problème pouvant être traité pendant 48 heures.
Les résultats ont non seulement été en tête, mais le système a également résolu 3 problèmes que tous les modèles précédents avaient échoué à résoudre.
Bien que nommé « assistant », il ressemble davantage à un collègue capable d’avoir des idées originales.
L’expert en théorie des groupes Marc Lackenby l’a utilisé dans ses recherches pour résoudre une conjecture publique dans le Cahier Kourovka.
Fait intéressant, la stratégie initiale proposée par le système a été jugée « défectueuse » par son propre agent de révision, mais Lackenby a repéré la finesse cachée dans cette proposition abandonnée, a comblé la lacune, et a finalement achevé la preuve.
Actuellement, le co-mathématicien IA n’est accessible en version bêta qu’à un petit groupe de mathématiciens.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateSquareMayTradingShare
992.44K Popularité
#
BTCBackAbove80K
59.44M Popularité
#
IsraelStrikesIranBTCPlunges
45.56K Popularité
#
JapanTokenizesGovernmentBonds
1.9M Popularité
#
#DailyPolymarketHotspot
866.41K Popularité

Épingler

DeepMind publie un assistant de recherche en mathématiques basé sur l'IA : une architecture multi-agent bat GPT-5.5Pro, et résout également un problème auparavant « insoluble »

Sujets populaires

GateSquareMayTradingShare

BTCBackAbove80K

IsraelStrikesIranBTCPlunges

JapanTokenizesGovernmentBonds

#DailyPolymarketHotspot

Épingler