AIコンピューティングにおいて、多くの人が正しく読み取れていない分割点がある。



フロンティアトレーニングは四半期ごとに集中度を増しており、数千のGPUが一か所に配置され、配線で結ばれている。しかし、トレーニングは2026年の需要のわずか30%に過ぎない。残りの70%は推論であり、それをハイパースケーラーで実行することは、最も負荷の高いワークロード向けに構築されたインフラを、最も簡単なワークロードのために支払うことを意味する。

分散ネットワーク上では、同じ推論が45~75%安く実行できる可能性があり、AIインフラの予算を策定する人にとって、その差こそがすべてを物語っている。

トレーニングは必然的に集中化する。推論は断片化する。なぜなら、Amazon Web Services(AWS)のマージンを必要としないワークロードに対して、そのマージンを支払うことが、規模が大きくなるにつれて意味をなさなくなるからだ。
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし