AIMPACT メッセージ、5 月 15 日(UTC+8)、マスクは X プラットフォームで次のように投稿しました。最新の Grok V9(1.5T パラメータ)トレーニング実行は「非常に良いパフォーマンス」を示し、この結果はまだ Cursor データの補足トレーニング部分に含まれていません。現在内部で開発中の基礎モデルバージョンは V9 で、パラメータ規模は約 1.5 兆であり、V8 と比較してデータクレンジング、トレーニング方法、モデル規模などの面で顕著な向上が見られ、Blackwell アーキテクチャに最適化されており、計算能力の効率的な利用を促進しています。マスクは強調しました。比較すると、現在外部向けのバージョン v4.2 は V8 基礎モデルを基に構築されており、パラメータ規模は約 0.5T、Hopper アーキテクチャ上で動作しており、トレーニングデータの質とカバレッジ範囲には依然として制限があります。Grok V8 と V9 の間には性能差が大きく、新世代モデルは全体的な能力で飛躍的なアップグレードを実現しています。(出典:ODAILY)
マスク:Grok V9とV8の差は大きく、V9のトレーニングバージョンはすでにより優れたパフォーマンスを示しています
AIMPACT メッセージ、5 月 15 日(UTC+8)、マスクは X プラットフォームで次のように投稿しました。最新の Grok V9(1.5T パラメータ)トレーニング実行は「非常に良いパフォーマンス」を示し、この結果はまだ Cursor データの補足トレーニング部分に含まれていません。現在内部で開発中の基礎モデルバージョンは V9 で、パラメータ規模は約 1.5 兆であり、V8 と比較してデータクレンジング、トレーニング方法、モデル規模などの面で顕著な向上が見られ、Blackwell アーキテクチャに最適化されており、計算能力の効率的な利用を促進しています。マスクは強調しました。比較すると、現在外部向けのバージョン v4.2 は V8 基礎モデルを基に構築されており、パラメータ規模は約 0.5T、Hopper アーキテクチャ上で動作しており、トレーニングデータの質とカバレッジ範囲には依然として制限があります。Grok V8 と V9 の間には性能差が大きく、新世代モデルは全体的な能力で飛躍的なアップグレードを実現しています。(出典:ODAILY)