獨立評估顯示 MiniMax M2.7 在核心智能體任務上媲美閉源前沿模型

robot
摘要生成中

ME News 消息,4 月 5 日(UTC+8),近日,根据 LangChain 的獨立評估,開放權重模型 MiniMax M2.7 在文件操作、工具調用和指令遵循等核心智能體任務上已達到與閉源前沿模型相當的水平。文中觀點認為,其優勢在於成本顯著降低約20倍,速度提升2-4倍。以每日輸出1000萬令牌為例,使用 Opus 4.6 的成本約為250美元/天,而 MiniMax M2.7 僅需約12美元/天。這一進展得益於 SWE-Rebench 和 Terminal Bench 2.0 等開放基準的推動,使得開放模型成為生產環境中部署智能體的可行選擇,並可與閉源模型協同使用。(來源:InFoQ)

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言