独立した評価によると、MiniMax M2.7 は中核となるエージェントのタスクにおいて、クローズドソースの最先端モデルに匹敵する

robot
概要作成中

MEニュースのメッセージ。4月5日(UTC+8)。近日、LangChainの独立評価によると、オープンウェイトモデルのMiniMax M2.7は、ファイル操作、ツール呼び出し、命令遵守などの中核的なエージェントタスクにおいて、クローズドの最先端モデルと同等の水準に到達した。記事の見解では、その強みはコストが約20分の1にまで大幅に低下し、速度が2〜4倍向上している点にある。たとえば1日あたり1000万トークンを出力する場合、Opus 4.6のコストは約250ドル/日だが、MiniMax M2.7は約12ドル/日で済む。この進展は、SWE-RebenchやTerminal Bench 2.0などのオープンベンチマークの推進によるもので、オープンモデルがプロダクション環境でエージェントをデプロイするための現実的な選択肢となり、クローズドモデルと協調して使用できる可能性も示されている。(出所:InFoQ)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン