Amazon publie le cadre Promptimus, optimisant automatiquement les invites pour les LLM

robot
Création du résumé en cours
AIMPACT message, le 15 mai (UTC+8), des scientifiques d'Amazon ont proposé un cadre d'ingénierie de prompts automatisés appelé Promptimus, qui permet d'améliorer des prompts LLM de haute qualité existants sans intervention humaine. Cette méthode utilise une stratégie d'optimisation itérative, exploitant un modèle "optimiseur" auxiliaire pour analyser l'interaction entre les prompts et la sortie du modèle, afin d'identifier et d'ajuster automatiquement la clarté des instructions, la sélection d'exemples et d'autres dimensions. Sur plusieurs benchmarks, notamment en raisonnement mathématique (taux de précision GSM8K passant de 78 % à 85 %), questions de connaissance générale et génération de code, les prompts optimisés ont amélioré en moyenne leurs performances de 5 % à 15 %. Ce cadre ne dépend pas d'une architecture LLM ou d'un type de tâche spécifique, il est donc universel, et utilise des termes de régularisation et une validation croisée pour éviter le surapprentissage, garantissant ainsi une bonne capacité de généralisation. (Source : InFoQ)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • 12
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
TransparentDomeCity
· Il y a 8h
L'ajustement automatique du prompt n'a enfin plus besoin de faire de la magie, les chercheurs en science sont ravis
Voir l'originalRépondre0
GovernanceMoodboard
· Il y a 8h
5-15% d'augmentation moyenne semble modeste, mais avec l'automatisation complète, ça compense
Voir l'originalRépondre0
StopLossSparrow
· Il y a 8h
Régularisation + validation croisée pour éviter le surapprentissage, les détails sont bien pris en compte
Voir l'originalRépondre0
GateUser-f49a50d4
· Il y a 8h
Le nom Promptimus sonne comme Transformers, mais l'effet est bien réel
Voir l'originalRépondre0
MoonlightTake-ProfitLine
· Il y a 8h
GSM8K passe de 78 % à 85 %, la logique mathématique est vraiment hardcore
Voir l'originalRépondre0
  • Épinglé