ME News のニュース、4 月 5 日(UTC+8)に、最近 LangChain の独立評価によれば、オープンウェイトモデルの MiniMax M2.7 は、ファイル操作、ツール呼び出し、指示遵守などの主要なエージェントタスクにおいて、クローズドな最先端モデルと同等の水準に到達している。記事の見解では、その強みはコストが約20倍大幅に低下し、速度が2〜4倍向上している点にある。1 日あたり 1000万トークンを出力する例では、Opus 4.6 のコストは約 250 ドル/日だが、MiniMax M2.7 は約 12 ドル/日で済む。この進展は SWE-Rebench や Terminal Bench 2.0 などのオープンベンチマークの推進によるもので、オープンモデルが実運用環境でエージェントをデプロイするための現実的な選択肢となり、クローズドモデルと併用することも可能だ。(出所:InFoQ)
独立した評価によると、MiniMax M2.7 は中核となるエージェントのタスクにおいて、クローズドソースの最先端モデルに匹敵する
ME News のニュース、4 月 5 日(UTC+8)に、最近 LangChain の独立評価によれば、オープンウェイトモデルの MiniMax M2.7 は、ファイル操作、ツール呼び出し、指示遵守などの主要なエージェントタスクにおいて、クローズドな最先端モデルと同等の水準に到達している。記事の見解では、その強みはコストが約20倍大幅に低下し、速度が2〜4倍向上している点にある。1 日あたり 1000万トークンを出力する例では、Opus 4.6 のコストは約 250 ドル/日だが、MiniMax M2.7 は約 12 ドル/日で済む。この進展は SWE-Rebench や Terminal Bench 2.0 などのオープンベンチマークの推進によるもので、オープンモデルが実運用環境でエージェントをデプロイするための現実的な選択肢となり、クローズドモデルと併用することも可能だ。(出所:InFoQ)