Sakana AIが多エージェントシステムFuguをリリース:スコアはGPT5.4とOpus4.6を超える

金色财经報道、日本 AI 研究開発会社 Sakana AI は、フラッグシップの商用製品 Sakana Fugu を発表し、早期 Beta テストの申請を開始した。システムはマルチエージェント編成システムとして位置付けられ、OpenAI 形式のシングルモデル API に対応し、サービスを提供する。低遅延最適化を重視した Sakana Fugu Mini と、厳しいタスク向けの Sakana Fugu Ultra を含む。
製品アーキテクチャは、チームが ICLR 2026 で発表した Trinity と Conductor の論文に基づいている。システムのコアは、自律学習する軽量な言語モデルであり、人工的に設定されたチーム役割や固定されたパイプラインに依存せず、タスクの難易度に応じて動的に Worker モデルプールを呼び出し、分担を割り当てる。システムはまた、テスト時のスケーリングをサポートし、自適応再帰呼び出し能力を備える。モデルは自身の以前の出力をコンテキストとして読み込み、実行中に欠陥を自主的に識別し、修正ワークフローを起動できる。ユーザーは再帰の深さを推論時の調整可能な計算資源軸として設定できる。
評価データによると、ハードコアな推論とコーディングのベンチマークテストで、Sakana Fugu Ultra は最先端のシングルモデルを超える性能を示した。GPQAD、LCBv6、SWEPro のテストでは、それぞれ 95.1、93.2、54.2 のスコアを獲得し、GPT 5.4、Gemini 3.1、Opus 4.6 などの主流フラッグシップシングルモデルよりも優れた結果を出した。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め