MiniMax新世代大規模言語モデルM2.7を発表

robot
概要作成中

新浪テクノロジー通信 3月18日午後のニュースです。MiniMaxは新世代のエージェントフラッグシップ大規模モデルM2.7を発表し、同モデルがAgent Harnessシステムを構築することで、自身の訓練と最適化プロセスに深く関与し、一部の研究開発シナリオにおいて30%から50%の作業量を担うことができ、内部評価セットで約30%の性能向上を実現したと発表しました。

コア能力において、M2.7はSWE-bench Proで56.22%の成績を収め、国際的な一線レベルに近づいています。また、VIBE-ProやTerminal Bench 2などの実際のエンジニアリングテストでも優れたパフォーマンスを示し、エンドツーエンドのプロジェクト納品や複雑なシステム理解をサポートします。オフィスシナリオでは、GDPval-AAのELOスコアは1495で、オープンソースの最高値であり、Officeドキュメントの処理や多回編集能力も大きく向上しています。

現在、M2.7はMiniMaxエージェントおよびオープンプラットフォームでグローバルに展開されています。(文猛)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン