1.5Tパラメータを直接V9にまで持っていく、マスクはAI軍備競争を最大化しようとしているのか、Blackwell最適化+データクレンジングのアップグレード、オープンソースコミュニティのレプリケーションを待つだけ

原文表示
MeNews
マスク:Grok V9とV8の差は大きく、V9のトレーニングバージョンはすでにより優れたパフォーマンスを示しています
AIMPACT メッセージ、5 月 15 日(UTC+8)、マスクは X プラットフォームで次のように投稿しました。
最新の Grok V9(1.5T パラメータ)トレーニング実行は「非常に良いパフォーマンス」を示し、この結果はまだ Cursor データの補足トレーニング部分に含まれていません。
現在内部で開発中の基礎モデルバージョンは V9 で、パラメータ規模は約 1.5兆であり、V8 と比較してデータクレンジング、トレーニング方法、モデル規模などの面で顕著な向上を遂げており、Blackwell アーキテクチャに最適化されて、計算能力の効率的な利用を促進しています。
マスクは強調しました。
比較すると、現在外部向けのバージョン v4.2 は V8 基礎モデルを基に構築されており、パラメータ規模は約 0.5T、Hopper アーキテクチャ上で動作しています。
トレーニングデータの質とカバレッジ範囲には依然として一定の制約があります。
Grok V8 と V9 の間の
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め