Исследование механизма разрыва между осознанием использования инструментов и действиями при использовании прокси

robot
Генерация тезисов в процессе
AIMPACT сообщение, 17 мая (UTC+8), эта статья о объяснимости, сосредоточенная на использовании инструментов через прокси, обнаруживающих скрытые состояния, при этом модель часто распознает необходимость вызова инструмента, но фактический вызов не происходит, уровень несоответствия достигает 26%-54%. Вопрос полностью сосредоточен на переходной стадии от когнитивных процессов к действиям, а не на самом когнитиве. Внутренние направления обнаружения могут быть декодированы, но механизм последнего токена в поздних слоях вызывает вращение сигнала, практически ортогональное к порождаемым действиям. Исследование направлено на прогнозирование эффективности вмешательств, указывая, что распространенные причины, такие как подсказки или недостаточная тренировка, могут игнорировать геометрическую структуру поздних слоев, что дает разумное объяснение пределам производительности при A/B тестировании подсказок по использованию инструментов. (Источник: AiHot)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено