産業革命の時代、石炭が安くなるほど、みんなが燃やす量も増えた。今のAI時代のトークンも同じだ


トークンが安くなればなるほど、AI製品はむしろより多く燃やせる
以前は一言質問すれば、モデルが一言答えるだけだった
今はワンクリックで、エージェントがバックグラウンドでタスクを分解し、資料を調べ、ツールを調整し、コードを書き、エラーを修正し、要約し、一連の流れを実行する
だから、単一のトークンは安くなったが、一つのタスクで消費するトークンはあまりにも多くなる
これが請求額が増え続ける理由だ
蒸気機関がより省煤炭になった後も、イギリスは石炭をあまり減らさなかった。なぜなら、石炭がよりコストパフォーマンスが良くなったからだ。より多くの機械や工場、鉄道が石炭を燃やし始めた
トークンもこの論理と同じだ
安くなればなるほど、エージェント、ディープリサーチ、AIプログラミング、長いコンテキスト、企業の自動化が本格的に動き出す
だから、AIのコストセンターはトレーニングから推論へと移行している
トレーニングは一時的に燃やすだけだが、推論はずっと燃やし続ける。ユーザーがオンラインにいる限り、それは燃え続ける。エージェントが動いている限り、それも燃え続ける。コンテキストが長くなるほど、キャッシュも大きくなる。メモリ、帯域幅、電力、冷却もすべて逼迫していく
これが、AI産業チェーンがGPUだけを見ることができない理由だ
HBM、DRAM、SSD、高度なパッケージ、光モジュール、スイッチングチップ、CPU、推論チップも、この推論需要によって再価格付けされる
AIアプリケーション企業も層別化を余儀なくされる
インターフェース層だけを提供し、クローズドAPIに頼る企業は、ユーザーが増えるほど請求額が増え、利益率は薄くなる
真の障壁は下層に沈み込む:ルーター、クォンタイズ、キャッシュ、バッチ処理、コンテキストの剪定、小型モデルが大型モデルに取って代わる
うん、トークンはまさに石炭だ
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン