La mise à jour de l’évaluateur de LangSmith, cette fois, permet aux agents IA de ne plus avoir à réinventer la roue

Voir l'original
MeNews
LangSmith déploie plus de 30 modèles d’évaluation, la vérification de la qualité des agents IA n’a plus besoin d’être écrite à partir de zéro
LangSmith publie une bibliothèque de modèles d’évaluateurs et des évaluateurs réutilisables, simplifiant le travail d’évaluation multi-niveaux des agents IA.
Les modèles couvrent cinq catégories principales : sécurité et protection, qualité des réponses, trajectoire d'exécution, analyse du comportement utilisateur et multimodal, avec des invites d’évaluation optimisées et des évaluateurs de règles, adaptés à la surveillance en ligne et aux expériences hors ligne.
Les évaluateurs réutilisables sont gérés de manière centralisée au niveau organisationnel, avec un nouvel onglet Évaluateurs, une possibilité de les monter en un clic sur de nouveaux projets, et des invites de mise à jour qui prennent effet globalement.
Open source et publié avec openevals v0.2.0, ajoutant la prise en charge multimodale.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé