AIMPACT сообщение, 17 мая (UTC+8), эта статья о объяснимости, сосредоточенная на использовании инструментов через прокси, обнаруживающих скрытые состояния, при этом модель часто распознает необходимость вызова инструмента, но фактический вызов не происходит, уровень несоответствия достигает 26%-54%. Вопрос полностью сосредоточен на переходной стадии от когнитивных процессов к действиям, а не на самом когнитиве. Внутренние направления обнаружения могут быть декодированы, но механизм последнего токена в поздних слоях вызывает вращение сигнала, практически ортогональное к порождаемым действиям. Исследование направлено на прогнозирование эффективности вмешательств, указывая, что распространенные причины, такие как подсказки или недостаточная тренировка, могут игнорировать геометрическую структуру поздних слоев, что дает разумное объяснение пределам производительности при A/B тестировании подсказок по использованию инструментов. (Источник: AiHot)

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
ShareYourUSStocksWinNvidia
3.34M Популярность
#
GatePartnersWithAlpacaToBridgeCryptoAndStocks
2.4M Популярность
#
IsraelStrikesIranBTCPlunges
53.18K Популярность
#
ETHPlunges5PercentBelow1800
5.08K Популярность
#
HYPEHitsAllTimeHigh
50.69K Популярность

Закреплено

Карта сайта

Исследование механизма разрыва между осознанием использования инструментов и действиями при использовании прокси

Популярные темы

ShareYourUSStocksWinNvidia

GatePartnersWithAlpacaToBridgeCryptoAndStocks

IsraelStrikesIranBTCPlunges

ETHPlunges5PercentBelow1800

HYPEHitsAllTimeHigh

Закреплено