torygreen

vip
期間 2.8 年
ピーク時のランク 0
現在、コンテンツはありません
2年前、このチャート上のオープンモデルは最下位に近い位置にあったでしょう。クローズドラボは数世代先を行っており、その差こそが人々がモデルを所有する代わりにレンタルする理由のすべてでした。
今、GLM-5.2は@ArtificialAnlysインデックスで51位に位置しています。
オープンウェイト、中国のラボ、全体で5位。そしてFableは利用不可のためリストから除外すると、オープンウェイトモデルはそのランキングが示すよりもはるかにトップに近いです。
クローズドの売りは常にリードでした。APIを支払い、条件を受け入れ、自分でコントロールできないものの上に構築する。モデルが十分に先を行っているから価値があるのです。そのリードは今やわずか数ポイントとなり、GLMはNvidiaチップのカットオフリストに載りながらそこに到達したことは、さらに印象的です。
プレミアムはそのギャップに対して価格設定されていました。ギャップはほぼなくなったのに、プレミアムは動いていません。
1年後、私たちがどこにいるのかを見るのが楽しみです。
GLM8.20%
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
AIコンピューティングにおいて、多くの人が正しく読み取れていない分割点がある。
フロンティアトレーニングは四半期ごとに集中度を増しており、数千のGPUが一か所に配置され、配線で結ばれている。しかし、トレーニングは2026年の需要のわずか30%に過ぎない。残りの70%は推論であり、それをハイパースケーラーで実行することは、最も負荷の高いワークロード向けに構築されたインフラを、最も簡単なワークロードのために支払うことを意味する。
分散ネットワーク上では、同じ推論が45~75%安く実行できる可能性があり、AIインフラの予算を策定する人にとって、その差こそがすべてを物語っている。
トレーニングは必然的に集中化する。推論は断片化する。なぜなら、Amazon Web Services(AWS)のマージンを必要としないワークロードに対して、そのマージンを支払うことが、規模が大きくなるにつれて意味をなさなくなるからだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
最近のGLM 5.2のニュースと、みんなが持ち出すオープンウェイトの角度について考えていたが、彼らはまったく別の角度を見逃している。
誰もが、中国の研究所がフロンティアレベルのパフォーマンスを達成し、それをオープンソース化したという事実に注目しているが、注目すべきはその方法だ。ZAIとその他の中国の研究所は2025年初頭にNvidiaから遮断されたため、それ以来H100やH200は直接入手できなかったと推定される。
彼らは $128B を超えた。おそらく中国製シリコンでトレーニングされたモデルが、フロンティアに数ポイント差で迫っている。
輸出管理は中国を減速させることを意図していた。実際には、競争をチップではなく電力に移行させた。中国が余剰に持つ唯一のインプットだ。1年間で543GWの容量が追加され、インドの全送電網より大きい。
2021年以来、中国は米国の全送電網が保持する量を超える新規電力を追加した。一方、米国の送電網はAI需要の下ですでにひっ迫している。
シリコンを制限することはできる。電力を制限することはできない。そして、制約を受けた側がオープンウェイトを出し続ける限り、業界全体がその恩恵を継承する。
GLM8.20%
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
今、企業のGPU容量の95%が使われずに座っている。
その数字は、一般的な調査ではなく、Cast AIが23,000の実際の運用クラスターを測定した結果から得られたものだ。
平均利用率は5%であり、NvidiaがH200の価格を15%引き上げたちょうどその瞬間に起こっている。これは20年ぶりの初めての値上げだ。誰もが不足していると言うハードウェアのほとんどは、ほとんど何もしていない。
もし、なぜ計算資源を入手するのが難しいと感じるのかを理解しようとしているなら、これがその理由だ。誰も数ヶ月待った割り当てを返さない。だから、フリートは5%のままで、時間単位で請求され、希少性が自己増殖している。これは供給の失敗ではなく、調整の失敗のようだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
いくつかの大きなEUのAI政策の動きが報じられているが、彼らが取り組んでいるインフラの現実はこうだ。
> EUの主権AIインフラへの2026年の支出額:126億ドル。
> 同じ年の米国ハイパースケーラーの資本支出:7250億ドル。
ヨーロッパは6年間で19のAIファクトリーと14のスーパーコンピューターを構築したが、今年だけでアマゾンだけがその全努力を2週間で超える支出をする。
ほとんどのヨーロッパのAIチームはヨーロッパのインフラを使わず、バージニアやアイオワからレンタルし、GDPR準拠のプレミアムをハイパースケーラーのマージンに上乗せして支払っている。新しいNvidiaハードウェアは米東部から3〜6ヶ月遅れてEUのデータセンターに到達する。大陸は、設計しないチップに構造的に依存し、制御しないファブで製造され、まず自国市場を優先する企業によって割り当てられている。
もう一つの天井は電力網だ。アイルランドのデータセンターはすでに国内電力の22%を消費している。EUの空き容量は年末までに6.5%に圧縮される。
政策発表だけでは57倍のギャップを埋められない。計算資源はすでに38か国にまたがって存在している。問題は、それが何か有効に接続されていないことだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
今年この数字が現れるとは思いませんでした。
GitHubは2026年までに140億回のコミットを達成する見込みです。これは2025年の10億から大きく増加しています。たった1年で14倍の増加で、そのほとんどは人間がコードを書いているわけではありません。
負荷が非常に高まったため、地球上で2番目に大きなクラウドを所有・運営するMicrosoftは、プラットフォームをオンラインに保つためにAWSを経由してトラフィックをルーティングしなければなりませんでした。5月だけで9件のサービス障害が発生し、可用性は88.4%に低下しました。
すべてのエンジニアリングチーム、インフラベンダー、クラウドプロバイダーにとって、人間の速度での開発のために容量を調整している基準値は、桁違いに動いたのです。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
Nvidiaの収益は、「エージェント的計算」が理論ではない証拠です。すでに損益計算書に記載されています。
$26B 4年前。昨年は2,159億ドル。ほとんどのAIがまだチャットボックスに座っていて、あなたが質問をするのを待っている間に、その8倍になったのです。
重要なのは成長だけではありません。Nvidiaがそのアーキテクチャをほぼすべての他者のロードマップにとって交渉不可能な入力に変えたことです。ラボ、クラウド、企業。APIのロゴは異なるが、下層のシリコンは同じです。このサイクルでAIインフラに費やされたほぼすべてのドルが、彼らのスタックのどこかに漏れています。
今、Jensenの主張を考えてみてください。エージェント的AIは生成AIの約10倍の計算能力を必要とする、と。それは誇張ではなく、配線です。チャットボットは一つの前方パスとアイドル状態です。計画し、実行し、自分の作業をチェックし、複数ステップの仕事をリトライするエージェントは、単一の結果のために何十、何百ものパスを行います。「オフ」スイッチはありません。作業は止まらないからです。
エンタープライズAIは今日約8%の浸透率で、2032年までに約67%に達すると予測されています。その曲線の各パーセンテージポイントは、さらに84億ドルのインフラ需要を意味します。
トレーニングはモデルを構築しました。推論はそれらをAPIの背後に
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
私はゴールドマンの5年分の数字がこれほど大きいとは思わなかった。
5つのハイパースケーラーは、2025年から2030年の間にAIインフラに5.3兆ドルを投資する見込みだ。2022年には合計で$162B を費やした。
今年は7,250億ドルの見込みだ。2027年までに、アナリストは1兆ドルに達すると予測している。
これらの5つのバランスシート以外でAI製品やインフラを構築している人にとって、この軌道は計画の前提で最も重要な数字だ。
彼らが展開できるものと、他のすべてがアクセスできるものとの間のギャップは、この継続期間ごとに増大していく。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
誰もがAIが最初に反復的な管理作業を引き継ぐと予測していた。データは異なることを示している。
意思決定は現在、職場のAI活動の28%を占めている。最も一般的な用途は自動化ではなく、判断である。
人々はAIを使って選択肢を分析し、トレードオフを評価し、自分が責任を持つ結論をサポートしている。そして、その変化は労働市場の問題を超えて重要となる。
判断に基づく作業負荷は継続的に行われ、1回のセッションあたりのコンテキストが多く必要であり、効率的にバッチ処理できない。
一日中意思決定を支援するAIのインフラ要件は、メールの下書きを行うAIのインフラとは全く異なる。
原文表示
post-image
  • 報酬
  • 1
  • リポスト
  • 共有
Millionairetasks:
皆さんにとって素晴らしいチャンスです
グローバルクラウドインフラストラクチャ2026年第1四半期。 1,290億ドルを単一四半期で達成。前年比35%の成長。
市場は急速に拡大しているが、集中度は変わっていない。AWS、Azure、Google Cloudは2年前とほぼ同じシェアを保持しているが、それらと他のすべての差は、ドル換算でこれまでで最も広くなっている。
それがパーセンテージチャートに示されていない部分だ。その他の部分は、実際の代替案に成長していない。比率は同じままで、3つのハイパースケーラーが毎四半期で数十億ドルの絶対収益を追加している。
異なる分布が出現するためのウィンドウは、広がっていない。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
PJMはアメリカ合衆国の13州と6500万人の人々に電力網を運営しています。これは世界最大の競争的卸売電力市場です。
その容量市場のクリア価格、将来の電力供給が需要を満たせるかどうかを示すレートは、2024年の28.92ドル/MWから2026年には329.17ドルに上昇しました。2つのオークションサイクル。
データセンターの需要が主な推進力として特定されています。2027/2028年のオークションはわずかに333.44ドルでクリアし、PJMは直接的に5,100 MWの負荷増加をデータセンターに帰属させています。
それは供給ショックや地政学的な出来事ではありません。AIの展開が、それに対応できない電力網に影響を与えているのです。
新しい施設を電力網に接続するには、ほとんどの地域で4年から10年かかります。施設の建設には2年から3年。
そのギャップに捕らわれたすべてのプロジェクトは、市場がクリアする価格を支払うことになります、その間待ちながら。
計算能力は整っています。電力が整っていないのです。
原文表示
post-image
  • 報酬
  • 2
  • リポスト
  • 共有
DiveNate:
2026 GOGOGO 👊
もっと見る
このチャートから2つの数字。
AI APIの価格:2022年以来96%下落。
ハイパースケーラーの資本支出:同じ期間に12倍増加。
ほとんどの人は最初の数字を見て、それを民主化と呼ぶが、二つ目の数字を軸に戦略を立てている人は誰もいない。
それは偶然ではない。それは構造的なキャプチャの戦略だ。
安価なモデルを祝うすべてのAIスタートアップは、自分たちが所有しない計算資源上で動いており、再現できないインフラ上で動いており、三つの企業によってコントロールされている。
ソブリンAIはソブリンインフラストラクチャから始まる。その他はすべて、より良い価格の依存関係に過ぎない。
原文表示
post-image
  • 報酬
  • 1
  • リポスト
  • 共有
Yuhuan:
gsgsgshsokzkzkzkxhxj
金曜日に明らかになったことは、政府がAIモデルを停止させることができるということではない。
それは、世界で最も能力の高いモデルの全世界のユーザーベースが、単一の企業の単一の運用決定の背後にあるということだ。警告や冗長性はない。
現在、最大手のAI企業3社が最先端のAIアクセスの88%を管理し、それに対するコンプライアンスの唯一の窓口となっている。
金曜日に明らかになったのは、計算資源とモデルアクセスが少数の企業の中に収まっているとき、全体のシステムが彼らの単一障害点を引き継ぐということだ。これは中央集権型AIに反対する議論ではない。両方のモデルが存在する必要がある。
しかし、分散型インフラが中央集権的なプロバイダーと並行して動作する世界は、そうでない世界とは構造的に異なる。
分散型計算には一つのコンプライアンス窓口がない。すべてを一度にオフラインにする単一の手紙は存在しない。これこそが今すぐに構築する必要があるアーキテクチャの部分だ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
2024年、AI計算マップには二つの超大国があった。アメリカは53.7 GW、中国は31.9 GW。
2026年、中国は2.5 GWになっている。
これは輸出政策を通じた国家のAIインフラ容量の制御された破壊である。爆弾も制裁もなく、チップ規制だけだ。
これが証明しているのは、計算能力が今や地政学的兵器であるということだ。自国のインフラを所有していない国は、その兵器の受け手になるのがどんなものか知りたくない。
問題は分散型計算が勝つかどうかではない。それが次の政策決定によって地図が再構築される前に到達するかどうかだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
2000年代最大のテックIPOはビザの280億ドルでした。
2010年代最大はアリババの1680億ドルでした。
およそ10年ごとに6倍です。
今、ラインを延長します。OpenAIとAnthropicはそれぞれ$1T 上場前から位置しています。
過去25年間の最大のテックデビューを合計すると、アリババ、フェイスブック、ウーバー、リヴィアン、スノーフレイク、パランティア、セレブラズ、コアウィーブ、すべて含めて。
およそ8000億ドルになります。
OpenAI + Anthropicだけでほぼ2兆ドルの価値があります。まだ非公開です。
ウォール街の最大上場の25年分の2.5倍の規模です、合計で。
しかし最大の構造的な違いは、ビザやアリババ、その他のテック企業が既存のインフラ上で拡大したことです。
決済レール、インターネット普及率、物流、そしてそれらの評価は構築されたキャパシティを収益化しました。
これらのAIの評価は、まだ存在しないキャパシティを前提としています。
データセンター、電力、GPU供給はまだ資金調達と展開を待っています。
$2T の価値は、誰も完成させていないインフラに価格付けされています。
そのギャップこそがこの時代の決定的な経済的チャンスです。
価値はそれを埋める者に蓄積されます。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
歴史の大半において、資本は機械を通じて拡大してきた。
今や、それは認知を通じて拡大している。
スタートアップは、ほぼゼロの限界コストで並列に動作する100万人のアナリスト、研究者、コーダー、戦略家に相当するものを一晩で呼び起こすことができる。
AI革命は、これまでのいかなる技術革命とも異なるものである。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
あなたはオープンチャーターで資金が現れると、そのオープン部分を任意とみなすことはできません
裁判は次の質問から始まりました:非営利団体をチャーターし、オープンAIをあなたの使命と呼び、その約束のもとで10年間使命志向のエンジニアと寄付資本を惹きつけ、その後利益制限付きの構造に変換して進化と呼ぶことができるのか?
イーロンは2018年にオープンAIを離れました。彼が求めている$130b の損害賠償金は非営利団体に行きます。彼を訴訟人としてどう見るかに関わらず、裁判所に記録されるべき問いは正しいものです:創設時の使命が下流で変換されても、元のチャーターがそのまま維持されている場合、慈善信託には執行可能な請求権があるのか?
すべてのオープンミッションAI組織は、その判決の下流に位置します:助成金で資金提供される研究所、使命の条件で支払われる才能、寄付者支援の非営利団体、「オープン」と約束したチャーターを持つ誰もが
12人の陪審員が意見を述べます。1人の裁判官が判決を下します
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
nvidiaは今や日本全体の経済規模を超え、そのAI請求が原因です
今あなたがAIに使う1ドルは、3つのクラウド上の1社のチップを通じて流れ、その会社がそれをマークアップして再販売しています
> AIスタートアップは調達資金の約80%を計算リースに費やしています
> シード段階のチームが1つのチップベンダーに月700,000ドルを支払っているのを見たことがあります
> データセンターは稼働率12-18%で動いており、あなたの請求は四半期ごとに上がっています
業界全体が一列に並び、同じ料金所にお金を渡すことに合意しました
ゲーム用のリグ、古いマイニングハードウェア、半空のデータセンターが各タイムゾーンに散らばっており、まるで誰も貸し出そうとしなかった予備の寝室のようにそこにあります
その供給を集約して稼働させると、価格は崩壊し、ハードウェアを持つ人々が実際に報酬を得ます
料金所は任意です。
あなたはただ支払い続けるだけです。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
AI-オーバービルド派は今四半期にH100を買おうとしたことがない
今H100を買おうと一週間費やすことは:AWSで12ヶ月のコミットメントをして(24/7の利用率をロックインし、最初のGPUを見る前に、GCPの待機リストはETAなし、LambdaとCoreWeaveは両方とも売り切れ、小さなプロバイダーも同じ答えを異なる言葉で伝えている
ハイパースケーラーの建設は年単位で測定され、CPU不足は既存のGPUを停滞させており、需要は増え続けている一方、ハイパースケーラーは許可を申請している
シード段階のAIチームは、製品に一人のユーザーも触れる前に、運転資金の70-80%をコンピュートに費やしている。待機リストに対して月700,000ドル
GPUはすでに存在している。データセンターやマイニングファームでアイドリング状態で、ハイパースケーラーが所有しない場所で、利用率は20%未満。どのハイパースケーラーも競合他社のハードウェアをレンタルしない
次にレンタルするH100はAWSから来るわけではない
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
どうやらNvidiaは静かに韓国の電力設備会社を訪問し、800V DCアーキテクチャを中心としたデータセンターインフラの再設計を依頼したようだ。
これは、集中型AIモデルが物理的な壁に直面していることの証明であり、各新しいチップ世代は常にスタックのどこかで新たな変電所の改修を必要としている。
世界のデータセンターはすでに12%から18%の稼働率で運用されている。暗号通貨マイニングファームには、Ethereumのマージ以降、アイドル状態の強力なGPUが存在している。4090を搭載したコンシューマーゲーミングリグも一日中机の上で未使用のままだ。
計算能力の不足は、物理学として隠された分配の問題だ。需要が3.4ヶ月ごとに倍増するのに、リトロフィングだけで解決できるわけではない。
ETH2.71%
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有