LangSmith эта серия библиотек шаблонов eval прямо сэкономила мне много времени на написание подсказок, поддержка мультимодальности тоже подтянулась, классно

Посмотреть Оригинал
MeNews
LangSmith запустил более 30 шаблонов оценки, проверка качества AI-агентов больше не требует написания с нуля
LangSmith выпустил библиотеку шаблонов оценщиков и повторно используемых оценщиков, упрощающих многоуровневую оценку AI-агентов. Шаблоны охватывают пять основных категорий: безопасность и защита, качество ответов, траектория выполнения, анализ поведения пользователей и мультимодальность, включая оптимизированные подсказки для оценки и правила оценки, подходящие для онлайн-мониторинга и офлайн-экспериментов. Повторно используемые оценщики централизованно управляются на уровне организации, добавлена вкладка Evaluators, возможность однократного прикрепления к новым проектам, обновленные подсказки для глобального применения, открытый исходный код и выпуск вместе с openevals v0.2.0, с добавленной поддержкой мультимодальности.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено