ME News ニュース、4月5日(UTC+8)、最近、LangChainの独立評価によると、オープンウェイトモデルのMiniMax M2.7は、ファイル操作、ツール呼び出し、指示遵守などのコアなエージェントタスクにおいて、クローズドソースの最先端モデルと同等のレベルに達している。記事の見解によると、その利点はコストが約20倍大幅に削減され、速度が2〜4倍向上したことである。1日に1000万トークンを出力する例では、Opus 4.6のコストは約250ドル/日だが、MiniMax M2.7はわずか約12ドル/日で済む。この進展は、SWE-RebenchやTerminal Bench 2.0などのオープンベンチマークの推進によるもので、オープンモデルが生産環境でエージェントを展開する実用的な選択肢となり、クローズドソースモデルと協調して使用できることを示している。(出典:InFoQ)
独立評価によると、MiniMax M2.7はコアインテリジェンスタスクにおいて、クローズドソースの最先端モデルに匹敵します
ME News ニュース、4月5日(UTC+8)、最近、LangChainの独立評価によると、オープンウェイトモデルのMiniMax M2.7は、ファイル操作、ツール呼び出し、指示遵守などのコアなエージェントタスクにおいて、クローズドソースの最先端モデルと同等のレベルに達している。記事の見解によると、その利点はコストが約20倍大幅に削減され、速度が2〜4倍向上したことである。1日に1000万トークンを出力する例では、Opus 4.6のコストは約250ドル/日だが、MiniMax M2.7はわずか約12ドル/日で済む。この進展は、SWE-RebenchやTerminal Bench 2.0などのオープンベンチマークの推進によるもので、オープンモデルが生産環境でエージェントを展開する実用的な選択肢となり、クローズドソースモデルと協調して使用できることを示している。(出典:InFoQ)