ガートナーは、ハードウェアおよびモデル設計の改善によって、2030年までに大規模言語モデルプロバイダーのAI推論コストが90%以上低下すると予測しています。 しかし、CIOは、エージェントAIのような高度な機能に対する需要の増加がトークンコストの上昇につながるため、これらの節約が直接的に還元されることは期待できません。 企業は、基盤となるAI能力への投資と、より複雑であるが高価な最前線アプリケーションの探求とのバランスを取って価値を引き出す必要があります。
AI推論のコストが急激に下がる見込み:ガートナー
ガートナーは、ハードウェアおよびモデル設計の改善によって、2030年までに大規模言語モデルプロバイダーのAI推論コストが90%以上低下すると予測しています。 しかし、CIOは、エージェントAIのような高度な機能に対する需要の増加がトークンコストの上昇につながるため、これらの節約が直接的に還元されることは期待できません。 企業は、基盤となるAI能力への投資と、より複雑であるが高価な最前線アプリケーションの探求とのバランスを取って価値を引き出す必要があります。