BenchJack 這名字起得妙,評測系統也得有人做紅隊測試了

查看原文
ME News
伯克利團隊宣布攻破8個主要智能體評測基準並開源工具
ME News 消息,4 月 19 日(UTC+8),伯克利人工智能研究小组(berkeley_ai)轉述了Dawn Song的聲明,宣布其團隊成功攻破了8個主要的智能體評測基準。團隊決定開源用於實現這一結果的工具,並將其命名為BenchJack。該工具被描述為"針對評測的滲透測試",旨在幫助其他開發者主動測試和發現自身評測系統的潛在弱點。(來源:InFoQ)
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆