狀態外置這招挺有意思,小模型也能玩轉長程檢索了,Harness-1 的開源值得跟一下

查看原文
币 界 网
币界網消息,20B檢索智能體Harness-1已開源,研究人員來自UIUC、UC Berkeley與Chroma。該模型通過狀態外置架構,將檢索過程中的記憶與整理工作交給環境端維護,使非前沿規模模型也能用極少訓練數據,在長程搜索任務中接近前沿模型表現。harness-1在覆蓋網頁、金融、專利和多跳問答的8項檢索基準上,平均篩選召回率達到0.730,比次優開源檢索子智能體高11.4個百分點,顯示顯式檢索狀態有助於模型學到更可遷移的搜索策略。
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆