国内初の国産AI推論千カードクラスターを構築し、クライドスカイレコメンは「国模国芯」のモデルのサンプルを提供しました。

robot
概要作成中

云天励飞(688343.SH)はまた42億元の大口契約を獲得しました。

3月12日、公開入札情報によると、云天励飞は湛江市のAI浸透支援による新たな生産力基盤インフラ整備プロジェクト(以下「湛江プロジェクト」)において落札し、落札金額は42億元となりました。本プロジェクトは、云天励飞が自主開発した国産AI推論加速カードを基盤とし、国産AI推論用の千台クラスのクラスタを構築します。クラスタにはDeepSeekなどの国産大規模モデルを搭載し、行政、産業、関連アプリケーションシナリオにおいて、より便利で低コストなAI能力を提供します。

云天励飞の2025年度業績速報によると、過去1年間で売上高は13.08億元に達し、前年同期比42.57%増加しました。一方、親会社に帰属する純損失は4.02億元で、前年同期比30.50%縮小しています。この42億元の算力基盤インフラ事業を受注したことは、自社開発チップの商業化能力の強力な証明であるとともに、今後の持続的な業績成長の原動力となるでしょう。

しかし、云天励飞にとって財務的な貢献以上に重要なのは、湛江プロジェクトの標杆的意義です。人工知能が実験室から産業の深みへと進む中で、計算能力の価値は単なるランキング指標ではなく、千行百業に恩恵をもたらす普及型の生産力へと変化しています。この観点から、湛江プロジェクトは短期的な収益促進だけでなく、云天励飞が自社の研究開発力を証明し、産業の高地を占めるための重要な戦略的一手です。

国内初の完全国産AI推論用千台クラスクラスタとして、湛江プロジェクトは云天励飞の推論計算能力の商用規模化のモデルケースであるだけでなく、「国模国芯」の深度融合の最良の実験場となり、万台クラスのクラスタ実現に向けて絶えず推進しています。

産業の焦点がトレーニングのピークから推論コストへと移行する中で、より低コストで安定した大規模推論能力を提供できる者が次のAI競争で優位に立つことになります。云天励飞が湛江に仕掛けたこの一手は、推論時代への重要な布石です。

AI計算能力の需要は「推論優先」へとシフト

従来の国内知能計算センターが一般的に採用してきた「訓練と推論を一体化する」構築モデルとは異なり、今回湛江に展開される云天励飞のプロジェクトは、より焦点を絞った技術路線を選択しています。それは、推論タスクに特化したAI推論クラスタを構築し、主に各種産業アプリケーションシナリオに向けて、従来産業のAI化を直接支援するものです。

この方向転換の背景には、AI産業のロジックにおける深い変革があります。

AIの計算能力体系は大きく分けて、トレーニング用と推論用に分類されます。トレーニング用計算能力は、モデルがゼロから一へと能力を構築する過程を決定し、絶対的な計算能力を重視します。一方、推論用計算能力は、既に訓練されたニューラルネットワークモデルを用いて推論・予測を行うもので、実用性を重視し、計算能力の要求は比較的低く、低遅延・低消費電力に重点を置きます。

過去数年、業界の関心はパラメータ規模の軍拡競争に集中し、百億、千億、さらには兆単位のパラメータを持つ大規模モデルが次々と登場し、各大手企業がモデル能力の高みを争ってきました。しかし、モデル能力が成熟するにつれ、産業界はより現実的な問いを投げかけ始めています。それは、「これほど強力なモデルは、実際にどのシナリオで価値を生み出せるのか?」というものです。

こうした背景から、推論用計算能力の重要性が高まっています。例えば、春节期間に話題となったSeeDance、最近広く議論されている小龍虾、各業界で次々に展開されるAIエージェントアプリケーションなど、すべて推論用計算能力の支えが不可欠です。市場調査会社Gartnerの予測によると、2026年にはAI専用クラウドインフラの約55%の支出が推論ワークロードに充てられる見込みです。

これはまさに云天励飞の強みです。この国産チップメーカーは長年推論用チップの研究に注力しており、独自の「計算能力積木」アーキテクチャは、国内先進工芸の下で柔軟に計算能力を拡張できる仕組みを実現しています。また、エッジ端末、具現智能、クラウドなどの分野に向けて、「深界」「深擎」「深穹」シリーズのチップを展開しています。

これらの技術的優位性により、云天励飞は湛江プロジェクトのニーズにより適切に応えることができています。

大規模モデルの推論アプリケーションには、高い同時処理能力、高スループット、低遅延のすべてを満たす必要があります。同時に、大規模モデルのコンテキスト長が増加するにつれ、多数の中間状態をKVキャッシュ(キー・バリューキャッシュ)として保存する必要が出てきます。したがって、業界では今後、推論システムの性能ボトルネックは計算能力だけでなく、データアクセス効率により多く依存するとの見方が一般的です。

この背景のもと、計算能力、ストレージ、ネットワークの協調設計が、AIインフラの重要な競争力となりつつあります。

今回湛江に導入された千台クラスの推論クラスタは、この考え方に基づいて構築されました。クラスタは、云天励飞が自主開発したAI推論チップを採用し、「プリフェッチ最適化を優先しつつ、デコードも考慮する」技術路線を確立しています。チップ設計において計算リソースとストレージ帯域幅をターゲットに調整し、長いコンテキストの推論シナリオでも高いスループットを維持できるよう工夫しています。

ネットワーク接続面では、統一高速インターコネクトアーキテクチャを採用し、400G光ネットワークを用いてクラスタの物理層ネットワークを構築。ノード間の高帯域・低遅延通信を実現しています。展開能力については、単一ノードで数十カード規模の拡張から、スムーズに千台クラスの大規模クラスタまで拡張可能であり、さまざまな規模のAIアプリケーションに対応します。

チップアーキテクチャ、ネットワークインターコネクト、システムスケジューリングの多層最適化により、この推論クラスタは全体的な効率とコスト制御において明確な優位性を持ち、AIの大規模展開により経済的な計算能力を提供します。

1億Tokenあたりのコストを1円に圧縮

云天励飞にとって、湛江プロジェクトの実現は始まりに過ぎません。

大規模モデルが実用段階に入るにつれ、産業界の関心は「計算能力のピーク」から「単位コスト効率」へとシフトしています。つまり、今後のAI産業競争の重要な軸は、モデルの能力そのものだけでなく、より低コストで安定した大規模推論能力を提供できるかどうかにかかっています。

推論用チップの先駆者である云天励飞は、この点を明確に認識しています。今年2月、云天励飞は「百万Token推論コストを毎年二桁減少させる」ことを目標に掲げ、今後3年間の大規模計算能力チップの計画を正式に発表しました。

具体的には、第一世代の超ノードPチップを今年リリースし、百万長コンテキストシナリオに向けて極限のプリフェッチ推論最適化を行います。計算能力はH100に追随します。次に、2027年には第一世代の超ノードDチップを開発し、デコード推論において超低遅延を実現します。最後に、2028年には第二世代の超ノードDチップを開発し、システムレベルの協調最適化を通じて、プリフェッチとデコードの性能を総合的に向上させ、ミリ秒級の推論遅延を目指します。

この青写真はすでに描かれていますが、いかに高度な技術計画も、最終的には実用シナリオでその商業価値を検証する必要があります。チップ設計は産業ニーズに本当に適合しているのか?プリフェッチとデコードのリソース配分は実負荷下で最適化できるのか?KVキャッシュによるデータアクセスの負荷は、千台クラスの規模で効果的に解消できるのか?これらの問いに対して、実験室だけでは最終的な答えは出せません。実産業環境での検証が必要です。

したがって、云天励飞にとって湛江プロジェクトは単なるプロジェクトの納品にとどまらず、技術の実戦演習の場となるのです。

湛江プロジェクトは三期に分けて建設され、すべて云天励飞自主開発の国産AI推論加速カードを採用します。第一期では、云天励飞X6000推論加速カードを展開します。第二・第三期では、同社の最新世代チップを搭載します。特に、云天励飞の最初のプリフェッチ専用チップDeepVerse100は、年内にサンプル出荷を完了し、湛江クラスタに先行して展開する予定です。

また、湛江プロジェクトが構築する千台クラスの推論クラスタは、非常に柔軟な展開能力も示しています。典型的なアーキテクチャでは、千台クラスのクラスタは多段階の拡張構造から成り、単一ノード8カード、32カード、64カード、さらには百カード超ノード、そしてノード間の大規模クラスタへと拡大します。この規模のシステムの実運用を通じて、カード間のインターコネクト、ノード間通信、負荷分散などの重要技術を検証し、云天励飞の将来のより大規模なAI計算能力システム構築に向けた経験を蓄積します。

長期的な計画として、云天励飞は「1001計画」を掲げています。これは、「百億Tokenを一円に」を長期目標とし、チップとシステムの協調最適化を通じて、大規模モデルの推論コストを継続的に低減させるものです。

この目標が実現すれば、AIは水や電気のように、あらゆる産業の基盤インフラとなるでしょう。そして、推論分野で先行して展開を進める云天励飞にとっては、「水を売る者」の時代が到来します。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン