Місія новин ME, 17 квітня (UTC+8), за даними моніторингу Датчі Beating, платформа для розробки AI-агентів LangChain випустила дві оновлення своїх інструментів спостереження LangSmith: бібліотеку шаблонів оцінювачів та повторно використовувані оцінювачі. Оцінка того, наскільки «зручний» AI-агент, є однією з найзайнятіших у процесі розробки. Агент може викликати правильний інструмент, але формат відповіді неправильний, одноповерховий діалог працює нормально, але при багатоповерховому він зламується, кінцева відповідь здається розумною, але проміжні кроки шукають неправильний документ. Розробники повинні встановлювати контрольні точки на рівнях окремих кроків, повного шляху, багатоповерхових діалогів, викликів конкретних інструментів, і кожен оцінювач проходить через процес написання підказок, калібрування за реальними даними, повторного налаштування, що часто займає кілька тижнів з нуля. Зараз LangSmith пропонує понад 30 готових шаблонів, що охоплюють п’ять класів.

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
TradfiTradingChallenge
241.55K Популярність
#
HYPEOutperformsAgain
16.33M Популярність
#
IsraelStrikesIranBTCPlunges
48.58K Популярність
#
#DailyPolymarketHotspot
1.01M Популярність
#
GateSquarePizzaDay
1.71M Популярність

Закріплено

карта сайту

Перед запуском агента штучного інтелекту, нарешті частина кошмарних етапів була контролювана за допомогою інструментальних зв’язків

Популярні теми

TradfiTradingChallenge

HYPEOutperformsAgain

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Закріплено