獨立評估顯示 MiniMax M2.7 在核心智能體任務上媲美閉源前沿模型

robot
摘要生成中

ME 新聞消息,4 月 5 日(UTC+8),近日,根據 LangChain 的獨立評估,開放權重模型 MiniMax M2.7 在檔案操作、工具呼叫與指令遵循等核心智能體任務上,已達到與閉源前沿模型相當的水準。文中觀點認為,其優勢在於成本顯著降低約 20 倍,速度提升 2-4 倍。以每日輸出 1000 萬令牌為例,使用 Opus 4.6 的成本約為 250 美元/天,而 MiniMax M2.7 僅需約 12 美元/天。這項進展得益於 SWE-Rebench 與 Terminal Bench 2.0 等開放基準的推動,使得開放模型成為在生產環境中部署智能體的可行選擇,並可與閉源模型協同使用。(來源:InFoQ)

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言