Environnement d'intelligence auto-évolutive open source Prime Intellect : faire que l'IA « s'affronte » pour générer plus de 8000 outils de test

AIMPACT message, le 19 mai (UTC+8), selon la surveillance de Dongcha Beating, Prime Intellect a annoncé l'ouverture de l'environnement d'entraînement d'agents intelligents general-agent, un environnement entièrement synthétique capable d'auto-évolution. La principale nouveauté de cette publication est la formulation de la génération de tâches comme un jeu à deux joueurs : un synthétiseur et un solveur s'affrontant alternativement, ayant actuellement construit automatiquement une grande base de données d'états comprenant 4504 tâches et plus de 8000 outils uniques. Ce cadre commence avec des tâches de départ simples, et, à l'aide de 9 stratégies telles que contraintes conditionnelles, instructions bruitées, couplage entre entités, divise les tâches en cinq niveaux de difficulté : t0 à t4. Le synthétiseur conçoit des tâches avec une base de données, des outils d'interaction et des fonctions de validation, tandis que le solveur tente de les résoudre. Seules les tâches dont le taux de réussite se situe dans une plage de difficulté spécifique sont conservées, et le niveau le plus difficile sert de semence pour la prochaine phase d'évolution. Les tests officiels montrent qu'en utilisant uniquement cet environnement pour synthétiser plus de 4400 trajectoires pour un modèle de 30 milliards de paramètres, la précision d'appel des outils dans le benchmark BFCL est passée de 18,9 % à 52,3 %. Ce mécanisme permet au modèle de se libérer de la dépendance à des ensembles de données statiques annotés manuellement. Grâce à un jeu d'affrontements directs entre modèles, le système peut générer en continu des données d'entraînement avec une difficulté contrôlable et une validation sémantique. (Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé