五大カテゴリーのテンプレート、新人でも素早く評価体系を構築できる

原文表示
MeNews
LangSmithは30以上の評価テンプレートをリリースし、AIエージェントの品質検査をゼロから書き直す必要がなくなりました
LangSmithは評価器テンプレートライブラリと再利用可能な評価器をリリースし、AIエージェントの多層評価作業を簡素化します。
テンプレートは、安全と防護、回答品質、実行履歴、ユーザー行動分析、マルチモーダルの五つのカテゴリーをカバーし、最適化された評価のヒントワードとルール評価器を含み、オンライン監視とオフライン実験に適用可能です。
再利用可能な評価器は組織レベルで集中管理でき、新たにEvaluatorsタブを追加し、ワンクリックで新しいプロジェクトにマウントし、ヒントワードの更新をグローバルに反映させることができ、オープンソース化され、openevals v0.2.0とともにリリースされ、多模態のサポートも追加されました。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め