Команда из Беркли объявила о взломе 8 основных эталонов оценки интеллектуальных агентов и открытии исходного кода инструментов

ME News Новости, 19 апреля (UTC+8), группа исследований искусственного интеллекта Беркли (berkeley_ai) передала заявление Dawn Song, объявив, что их команда успешно преодолела 8 основных критериев оценки интеллектуальных агентов. Команда решила открыть исходный код используемых инструментов для достижения этого результата и назвала его BenchJack. Этот инструмент описывается как "проникновение в тесты оценки", предназначенное для помощи другим разработчикам в активном тестировании и выявлении потенциальных слабых мест в их системах оценки. (Источник: InFoQ)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 9
  • 1
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
DrinkWaterBeforeTheMarket
· 15м назад
Инструменты с открытым исходным кодом + открытая методология — вот как должна выглядеть академическая сфера
Посмотреть ОригиналОтветить0
ElevatorMeme
· 2ч назад
Интересно, как именно они взломали, жду статью.
Посмотреть ОригиналОтветить0
FrontrunFail
· 3ч назад
8 основных бенчмарков полностью сломаны, в сфере оценки начинается землетрясение
Посмотреть ОригиналОтветить0
AutumnSlopeCabin
· 3ч назад
Для оценки проникновения тестирование, этот концепт довольно свежий
Посмотреть ОригиналОтветить0
OutsiderOfZhiyuandao
· 4ч назад
Команда Dawn Song вмешивается, и я считаю, что это действительно ценно
Посмотреть ОригиналОтветить0
ChaintraceAuntie
· 4ч назад
Инструмент оценки интеллектуальных агентов «Зеркало для выявления демонов» запущен
Посмотреть ОригиналОтветить0
SnackFi
· 4ч назад
Активный поиск слабых сторон лучше, чем пассивное получение ударов, поддерживайте этот дух открытого исходного кода
Посмотреть ОригиналОтветить0
ColdWalletFitnessCoach
· 4ч назад
В будущем при просмотре таблицы лидеров сначала спросите: Защищены ли вы от BenchJack?
Посмотреть ОригиналОтветить0
HedgeHedgeBaby
· 4ч назад
BenchJack 这个名字有点意思,benchmark + hijack 是吧
Посмотреть ОригиналОтветить0
Подробнее
  • Закреплено