ME Newsのメッセージ:4月5日(UTC+8)。近日、LangChainの独立評価によると、オープンウェイトモデルのMiniMax M2.7は、ファイル操作、ツール呼び出し、指示遵守などの中核となるエージェントタスクにおいて、クローズドな最先端モデルと同等の水準に到達している。記事の見解では、その強みはコストが約20倍大幅に低下し、速度が2〜4倍向上した点にある。1日あたり1000万トークンを出力する例では、Opus 4.6のコストは約250ドル/日だが、MiniMax M2.7は約12ドル/日で済む。この進展は、SWE-RebenchやTerminal Bench 2.0などのオープンベンチマークの推進によるもので、オープンモデルがプロダクション環境でエージェントをデプロイするための実行可能な選択肢となり、クローズドモデルと協調して使用できるという。(出典:InFoQ)
独立した評価によると、MiniMax M2.7 は中核となるエージェントのタスクにおいて、クローズドソースの最先端モデルに匹敵する
ME Newsのメッセージ:4月5日(UTC+8)。近日、LangChainの独立評価によると、オープンウェイトモデルのMiniMax M2.7は、ファイル操作、ツール呼び出し、指示遵守などの中核となるエージェントタスクにおいて、クローズドな最先端モデルと同等の水準に到達している。記事の見解では、その強みはコストが約20倍大幅に低下し、速度が2〜4倍向上した点にある。1日あたり1000万トークンを出力する例では、Opus 4.6のコストは約250ドル/日だが、MiniMax M2.7は約12ドル/日で済む。この進展は、SWE-RebenchやTerminal Bench 2.0などのオープンベンチマークの推進によるもので、オープンモデルがプロダクション環境でエージェントをデプロイするための実行可能な選択肢となり、クローズドモデルと協調して使用できるという。(出典:InFoQ)