Дауна Сонг считает, что это очень важная точка зрения: смотреть только на оценки — всё равно что смотреть только на общий балл медицинского отчёта, на самом деле нужно спрашивать «где всё плохо, как именно всё сломано». Оценка интеллектуальных систем должна быть такой же, разбивая неудачи на диагностируемые модели, чтобы можно было назначить правильное лечение.

Посмотреть Оригинал
MeNews
Берке́лийский ИИ подчеркивает, что понимание причин неудачи важнее, чем базовые показатели.
Исследования Berkeley AI и взгляды Dawn Song подчеркивают, что при оценке интеллектуальных агентов следует уделять внимание конкретным причинам неудач понимания, а не только базовым баллам. Необходимо разбивать долгосрочные неудачи на диагностируемые модели, чтобы точнее определить и проанализировать, где и почему агент терпит неудачу. В исходном тексте не предоставлена информация о конкретных критериях оценки, деталях анализа или классификации моделей неудач.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено