前OpenAI研究員推出Context Engine:agent掛記憶後低推理打平中推理

robot
摘要生成中
幣界網消息,前OpenAI研究員創辦的Applied Compute發布了Context Engine,這是一套企業agent的上下文引擎。該引擎將內部文檔、工單歷史和agent運行軌跡提煉成知識庫contextbase,agent在執行任務時可直接檢索,降低推理預算。在apex-agents(Mercor開發的投行、諮詢、法律專業評測)上,GPT-5.4的低推理檔從44.5%提升至52.4%,與不掛記憶的中推理檔52.3%基本持平。低推理提升7.9%,中推理提升3.7%,極高推理反而下降0.7%。中推理基線上,apex-agents的GPT-5.4從44.2%提升至51.7%,相對提升16.9%;GPT-5.4-mini從33.4%提升至38.7%,相對提升15.8%。Applied Compute認為,任務間可復用結構少,基線分已接近天花板。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆