マスク:Grok V9とV8の差は大きく、V9のトレーニングバージョンはすでにより優れたパフォーマンスを示しています

robot
概要作成中
AIMPACT メッセージ、5 月 15 日(UTC+8)、マスクは X プラットフォームで次のように投稿しました。最新の Grok V9(1.5T パラメータ)トレーニング実行は「非常に良いパフォーマンス」を示し、この結果はまだ Cursor データの補足トレーニング部分に含まれていません。現在内部で開発中の基礎モデルバージョンは V9 で、パラメータ規模は約 1.5 兆であり、V8 と比較してデータクレンジング、トレーニング方法、モデル規模などの面で顕著な向上が見られ、Blackwell アーキテクチャに最適化されており、計算能力の利用効率を向上させています。マスクは強調しました。比較すると、現在外部向けのバージョン v4.2 は V8 基礎モデルを基に構築されており、パラメータ規模は約 0.5T、Hopper アーキテクチャ上で動作しており、トレーニングデータの質とカバレッジ範囲にはまだ一定の制限があります。Grok V8 と V9 の間には性能差が大きく、新世代モデルは全体的な能力で飛躍的なアップグレードを実現しています。(出典:ODAILY)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 8
  • 1
  • 共有
コメント
コメントを追加
コメントを追加
StardustUnderTheGlassDome
· 4時間前
好奇 V9 の幻覚率は改善されたのか、大規模モデルは大きいほど良いわけではない
原文表示返信0
SudoSage
· 7時間前
越境的升级这个词从マスクの口から出てくると、通常は本当に何かがあることを意味します
原文表示返信0
YieldKaraoke
· 8時間前
外部ではHopperを運用し続けているが、内部はすでにBlackwellで、情報格差を巧みに操っている
原文表示返信0
GateUser-53a6e1a8
· 8時間前
データクレンジングの重要性がやっと認識されてきました。以前のGrokの返信の質は確かに波がありました。
原文表示返信0
Don'tCallMeABagHolder.
· 8時間前
Blackwell アーキテクチャの最適化は重要であり、計算能力の利用率向上が直接的に収益性を左右します
原文表示返信0
LimeLeverageAlert
· 8時間前
Cursorの統合を待つと、V9のこのパラメータ規模はちょっと異常だ
原文表示返信0
BlackVelvetBluePeony
· 8時間前
Blackwell 最適化の説明で老黄とマスクがますます結びついてきている
原文表示返信0
Post-RainCancellationAgent
· 8時間前
0.5T から 1.5T までの3倍のパラメータ、差は確かに大きい
原文表示返信0
  • ピン留め