La licorne japonaise de l'IA lance Sakana Fugu : appel automatique à plusieurs modèles pouvant rivaliser avec Claude Mythos ? Résultats, prix, tout en un aperçu

Plusieurs modèles d'IA collaborent, ne présentant qu'une seule API à l'extérieur, Sakana AI a officiellement lancé Sakana Fugu le 22 juin 2026, un système de modèles coordonnés entraînés par apprentissage par renforcement pour répartir automatiquement les tâches entre plusieurs agents spécialisés.
(Précédent : Anthropic, bloqué par le gouvernement américain, retire le modèle Fable, les médias étrangers évoquent trois préoccupations majeures : risque d'aider la Chine à ouvrir l'IA)
(Complément d'information : Elon Musk devient un marchand d'armements de puissance de calcul ! SpaceX signe un contrat de 6,3 milliards de dollars avec Reflection, louant Nvidia GB300 pour soutenir l'IA open source)

Table des matières

Basculer

  • Fonctionnement du modèle de commandant
  • Modèles de haut niveau concurrents limités
  • Structure tarifaire et restrictions du marché

Plusieurs modèles d'IA de pointe sont déployés simultanément, mais il suffit d'appeler une seule API, c'est la principale stratégie de Sakana AI avec Fugu. Ce lundi (22), le laboratoire japonais Sakana AI a officiellement lancé Sakana Fugu.

Positionné comme « remplacement d’un seul modèle par un système » : un cadre automatisé pour commander plusieurs agents spécialisés en collaboration, ne révélant qu'une seule interface API compatible OpenAI. Les utilisateurs n'ont pas besoin de connaître le nombre de modèles en arrière-plan ni de concevoir manuellement des processus de collaboration, tout est géré par le mécanisme de commandement interne de Fugu.

Fonctionnement du modèle de commandant

L'architecture sous-jacente de Fugu comporte deux innovations : TRINITY et Conductor.

TRINITY a conçu une architecture triangulaire : la tâche est décomposée en trois rôles, « Penseur (Thinker) » responsable de la planification, « Exécutant (Worker) » chargé de l'exécution, « Vérificateur (Verifier) » chargé de détecter les erreurs.

Les trois rôles sont occupés par différents LLM, formant un groupe de travail équilibré. En résumé : on évite qu’un même modèle propose une solution et corrige ses réponses.

Conductor est le cœur du système, un modèle de coordination entraîné par apprentissage par renforcement avec 7 milliards de paramètres, chargé de décider quels agents appeler pour chaque tâche, comment faire communiquer ces agents, et comment intégrer la sortie finale. Ce modèle ne dépend pas d’un flux de travail préconçu, mais explore lui-même la voie la plus efficace de collaboration, que Sakana qualifie de « mode de coopération non intuitif mais efficace ».

Le pool d'agents peut être ajusté de manière flexible. Le niveau Standard permet aux entreprises d'exclure certains fournisseurs ou modèles pour respecter la confidentialité ou la conformité, ce qui constitue une différenciation clé pour les organisations ne permettant pas la sortie de données.

Modèles de haut niveau concurrents limités

Sakana utilise quatre critères pour comparer la performance de Fugu avec celle des modèles de pointe.

  • SWE Bench Pro (capacité de correction de code logiciel) : Fugu 59,0, Fugu Ultra 73,7
  • LiveCodeBench (compétition de programmation en temps réel) : Fugu 92,9, Fugu Ultra 93,2
  • GPQA Diamond (questions interdisciplinaires de niveau postgraduate, proche de l’examen de doctorat) : Fugu et Fugu Ultra tous deux à 95,5
  • Humanity’s Last Exam ( banque de questions extrêmement difficiles conçue par des chercheurs de renom mondial) : Fugu 47,2, Fugu Ultra 50,0.

Sakana affirme que ces chiffres « rivalisent avec Mythos Preview et Fable 5 dans des tests stricts », mais restent à confirmer par des tiers.

Structure tarifaire et restrictions du marché

Fugu propose trois niveaux d’abonnement : Standard à 20 dollars par mois, Pro à 100 dollars par mois (dix fois la capacité), Max à 200 dollars par mois (vingt fois la capacité), tous incluant l’accès à Fugu et Fugu Ultra.

Une offre de tarification pour entreprises basée sur des tokens est également disponible : Fugu Ultra coûte 5 dollars par million de tokens d’entrée, 30 dollars par million de tokens de sortie ; pour des scénarios avec plus de 272 000 tokens en contexte long, les tarifs sont ajustés à 10 dollars d’entrée et 45 dollars de sortie.

Une logique tarifaire notable : Sakana insiste sur le fait que collaborer avec plus d'agents dans une tâche n’entraîne pas une augmentation proportionnelle des coûts. La tarification est basée sur le modèle le plus élevé dans le pool d'agents actifs, appliqué à l’ensemble, ce qui signifie qu’ajouter un deuxième ou un troisième agent ne double pas la facture. Comparé à l’intégration de plusieurs API, cela offre un avantage évident en termes de coûts pour des tâches complexes.

La restriction la plus claire actuellement concerne la géographie : Fugu n’est pas accessible aux utilisateurs de l’Union européenne et de l’Espace économique européen (EEE), la société indique qu’elle travaille à la certification GDPR, sans date précise. Les premiers abonnés avant juillet 2026 bénéficieront d’un deuxième mois gratuit.

Faire collaborer plusieurs modèles pour surpasser un seul n’est pas une idée nouvelle de Sakana. Leur véritable proposition est que chaque agent dans l’architecture du commandant peut être remplacé, ce qui limite le plafond du système à aucun fournisseur unique.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé