ME ニュース、4 月 5 日(UTC+8)。近日、LangChain の独立評価によると、オープンウェイトモデルの MiniMax M2.7 は、ファイル操作、ツール呼び出し、指示遵守などの中核的なエージェントタスクにおいて、クローズド型の最先端モデルと同等の水準に到達している。記事内の見解では、その強みはコストが約20倍大幅に低下しており、速度は2〜4倍向上している点にある。1 日あたり 1000 万トークンの出力を例にすると、Opus 4.6 のコストは約 250 ドル/日であるのに対し、MiniMax M2.7 は約 12 ドル/日で済む。この進展は、SWE-Rebench や Terminal Bench 2.0 などのオープンベンチマークの後押しによってもたらされ、オープンモデルが実運用環境でエージェントをデプロイするための現実的な選択肢となり、クローズド型モデルと協調して利用できる。(出所:InFoQ)
独立した評価によると、MiniMax M2.7 は中核となるエージェントのタスクにおいて、クローズドソースの最先端モデルに匹敵する
ME ニュース、4 月 5 日(UTC+8)。近日、LangChain の独立評価によると、オープンウェイトモデルの MiniMax M2.7 は、ファイル操作、ツール呼び出し、指示遵守などの中核的なエージェントタスクにおいて、クローズド型の最先端モデルと同等の水準に到達している。記事内の見解では、その強みはコストが約20倍大幅に低下しており、速度は2〜4倍向上している点にある。1 日あたり 1000 万トークンの出力を例にすると、Opus 4.6 のコストは約 250 ドル/日であるのに対し、MiniMax M2.7 は約 12 ドル/日で済む。この進展は、SWE-Rebench や Terminal Bench 2.0 などのオープンベンチマークの後押しによってもたらされ、オープンモデルが実運用環境でエージェントをデプロイするための現実的な選択肢となり、クローズド型モデルと協調して利用できる。(出所:InFoQ)