> 株式投資は金麒麟のアナリストレポートを見ればよい。権威があり、専門的で、タイムリーで、包括的で、あなたの潜在的なテーマ機会の掘り起こしを支援します! 出所:北京商報 「Token」がAI業界で最も熱い言葉になりつつある。最近開催された2026年 中関村フォーラム年次会議では、Kimiの創業者兼CEOの楊植麟氏と、智谱のCEOの張鹏氏の話題にそれが避けて通れなかった。楊植麟氏はTokenを将来のGDPと定義し、張鹏氏は「Tokenは長期的に低価格での競争に頼ることは業界の発展に不利だ」と率直に述べた。1000キロメートル超離れた場所でも、腾讯の上級執行副総裁の湯道生氏と副総裁の李強氏がそれぞれTokenに言及している。前者は「同じモデル能力であっても、異なるHarness(足場)の設計によってTokenのコストは大きく異なる」とし、後者は「Tokenの切り替えは容易だが、粘着性は弱く、補助金を止めれば顧客は簡単に流出する」と考えた。OpenClaw(ネット上のニックネーム「龍蝦(ロブスター)」)らがToken消費を指数関数的に爆発させると、Tokenはもはや単なる技術用語ではなく、ビジネスモデルに関わる重要な変数になった。 Token「コストを燃やし尽くす」 龍蝦が巻き起こしたエージェントの熱狂により、Token消費量は指数関数的に爆発している。Tokenとは何か?国家データ局の定義では、AIの大規模モデルが情報を処理するための最小単位であり、Tokenは測定可能で、価格付け可能で、取引可能だ。 百度千帆プラットフォームのプロダクト責任者である張婷氏は、北京商報の記者に対し次のように説明した。「それは、ある1文字と完全に等しいわけでもなく、ある1語と完全に等しいわけでもなく、2つの間にある一種の『言語断片』です。たとえば漢字の『我(私)』はTokenであり、『今日(きょう)』もTokenかもしれないが、『国際化(インターナショナリゼーション)』は『国際』と『化』の2つのTokenに分解される可能性があります。大規模モデルが扱う言語はグローバルだからです。Tokenは、モデルがあらゆる言語や記号を統一的な方法で処理できる、汎用的な『最大公約数』です」。 国家データ局の発表によると、2024年初めの中国の日次平均Token呼び出し量は1000億だった。2025年末までに100万億へと跳ね上がり、2026年3月にはすでに140万億を突破した。2年間で増加は1000倍超だ。 クラウド事業者とAI大規模モデル企業の反応は2月から始まり、智谱はGLM Coding Planの初回購入の割引を取り消し、パッケージ価格の全体の上昇幅は30%からとなった。3月上旬には、腾讯クラウドが2つの自社開発モデルの価格を引き上げ、そのうちTencent HY2.0 Instructモデルの上昇幅は463%に達した。下旬には阿里雲と百度智能云が同日でAI計算能力の値上げを発表し、最大の上昇幅は34%となった。 エージェントが爆発的に人気になり、その結果Token消費が増大するというロジックの連鎖について、張鹏氏は近日、詳細に説明した。複雑なタスクに直面したとき、Agentは思考のプロセスが長くなり、Token消費量は非常に大きくなる。そのためモデル推論のコストもそれに応じて上がる。だからこそTokenの価格を、正常な商業的価値へと戻す必要がある。長期的に低価格競争に頼ることも、業界全体の発展に不利だ。 北京商報の記者などのメディア取材で、李強氏は次のように述べた。「Tokenの経済性は、すぐにすべての顧客の関心を引くでしょう。もし消費量だけを考えて経済性を考えないなら、ユーザー側の価格やコストはさらに高くなる可能性があり、これは会社の長期的で健全な発展に対してマイナスの影響になります」。 Harness「足場」は水面下に隠れている Tokenは一体どのように価格付けされるのか?張婷氏は北京商報の記者に対し、例を挙げて分解して説明した。「たとえば『今日の北京の天気はどうですか』という質問に、AIの回答を加えると、おおよそ50〜100個のTokenを消費します。AIに800字の作文を書かせると、あなたのプロンプトと完全な出力を含めて、おおよそ1000〜1500個のToken消費になります」。「お金に換算すると、現在百度千帆プラットフォーム上の主流モデルの価格は、100万Tokenあたり数セント程度です。つまり1元(1ブロック)で、AIに約1000本の800字作文を書かせられるということです」と張婷氏は述べた。 しかし、Token消費量が指数関数的に増えると、より深い問題が浮かび上がってくる。これらのTokenのすべてが「刃先」に使われているわけではないのだ。Tokenはガソリンのようで、Agentは自動車のエンジンのようだ。燃費ばかりを気にして、エンジンの経済性や出力能力を見ないと、最終的に顧客はそれを捨てることになる。李強氏はガソリン消費でTokenの効率を読み解いた。 Nextie(明日新程)の創業者であり、「小冰之父(シャオビンの父)」でもある李笛氏も、北京商報の記者に対して次のように述べた。「Token消費の熱が指し示すのは、面白い現象です。Tokenmaxxing(つまりTokenを刷る量勝負)で、今は多くの開発者や会社がToken消費量を狂ったように刷っており、さらにはそれを一種の『計算能力の筋肉(アピール)』の展示だと見なしています。でも、こうした節度のない燃焼は、巨大なROI(投資回収率)の不均衡をもたらします」。 以上の背景のもと、もう一つの概念であるHarnessは、シリコンバレーと国内の技術コミュニティで急速に注目を集めている。 李笛氏は北京商報の記者に対し、Harnessの直訳は「鞍具」または「手綱(たづな)」だと詳しく説明した。もし大規模モデルが、力は強いが進む方向が定まらない野馬だとするなら、Harnessは、その野馬が定められたレール上を走れるようにする一式の制約システムである。 「AIの実装はアルゴリズムの問題だけでなく、エンジニアリングの問題でもある」と湯道生氏はこの判断を投げかけた。「同じモデル能力のもとで、異なる足場やHarnessの設計、たとえばモデルにどんなツールを呼び出させるか、階層構造を持つコンテキストのエンジニアリング、長期記憶の管理、ワークフローの実現などが、実際の使用効果やTokenコストに大きな影響を与えます」。 MiMo大規模モデルの責任者である羅福莉氏も、OpenClawの価値を解釈する際にこの名詞に触れた。「OpenClawは、国内のあの『セミクローズド』な水準のモデルの上限を非常に高く引き上げると同時に、Harness(制約制御体系)などの一連の設計によって、モデルのタスク完了度と正確率を保証し、下限も十分に担保している」。 クラウド事業者が「土台」を作り直す 具体的にはエンジニアリングの層で、腾讯クラウドのインテリジェント・エージェント開発プラットフォームADPは、RAG(検索強化生成)、ナレッジベースなどの能力によってエージェントを「図書館」につなげ、業界の専門家が常にオンラインでいられるようにする。次にClawはAgent Runtimeの安全サンドボックス上で動作する。Clawはインテリジェントシステムの神経中枢として、スキルバンクから発見しSkillsをダウンロードすることで外部システムと連携する能力を継続的に学習・蓄積し、大規模モデルを用いて対外の指示の受け渡しを行ってアクションを引き起こす。AgentRuntimeのサンドボックス方式は、大規模モデルの強化学習プログラム結果の検証にも使うことができ、強化学習の学習効率を高められる。 これは基盤インフラの氷山の一角にすぎない。 「計算能力の行き着く先は、もしかすると電力だ」と李強氏は取材で明かした。腾讯は2年前から計算と電力の協調(算電協同)を探索し始めた。「協力パートナーとともに内モンゴルで、現地の風力発電と光・蓄エネルギーを用いて直接データセンターへ電力を供給し、さらに水素エネルギーと蓄エネルギーで、クリーンエネルギーのピークと谷をバランスさせる。合わせて計算能力のピーク期とオフピーク期も調整する。これにより一方では電力コストを大幅に下げ、他方では炭素排出量も抑える」。 もう一段階の変化は、調達(ディスパッチ)の仕組みに起きている。「現在のクラウドコンピューティング時代のインフラは、人間のエンジニアをサービスするために設計されており、AIのためではありません。長期的には、インフラは一体のものであるべきで、この一式は自己進化し自己反復でき、自律的な組織を形成できるはずです。つまり、一連のインフラを、認められたCEOが管理するのと同じような形です。それはたぶんClawであり、AIの顧客ニーズに基づいて、自律的に自分のインフラを反復していく可能性があります」と、無问芯穹の共同創業者兼CEOの夏立雪氏は説明した。 注目すべきなのは、現時点で主要クラウド事業者は二重のアイデンティティを持っていることだ。阿里雲、腾讯クラウド、百度智能云はいずれもTokenの供給側であり、同時にTokenの消費側でもある。 阿里雲が最近公表した目標によれば、今後5年で、クラウドとAIの商業化による年収は1000億米ドルを突破する。さらに阿里グループは、従業員にToken枠を提供し、従業員が仕事の中で先進的なAIモデルとツールを使うことを後押しする。 李強氏は「Tokenは確かに腾讯クラウドにとって非常に重要な管理指標の一つだが、Tokenを最優先順位に置いておらず、極端な報奨政策で推進もしない。腾讯はより良いエンジンの研究開発にリソースを振り向け、使いやすいAIプロダクトを提供することで、実際のToken消費を生み出すことを好む」と述べた。2025年に腾讯クラウドは規模化して収益化を達成し、「2026年はあまり攻めすぎたくない」と李強氏は率直に言った。 140万億Tokenが産業を揺さぶるとき、次のラウンドの勝負もすでに始まっている。 北京商報記者 魏蔚 新浪の声明:本ニュースは新浪の提携メディアからの転載です。新浪網はより多くの情報を伝える目的でこの記事を掲載しており、その内容が主張する見解を支持するものではなく、またその記述内容を裏付けるものでもありません。記事内容は参考にのみ供するものであり、投資助言を構成しません。投資家がこれをもとに行動する場合、リスクは自己負担です。 膨大な情報、精密な解説は、Sina Finance APPにお任せください 編集担当:高佳
“Token”経済学:AIは再び会計をやり直す必要がある
出所:北京商報
「Token」がAI業界で最も熱い言葉になりつつある。最近開催された2026年 中関村フォーラム年次会議では、Kimiの創業者兼CEOの楊植麟氏と、智谱のCEOの張鹏氏の話題にそれが避けて通れなかった。楊植麟氏はTokenを将来のGDPと定義し、張鹏氏は「Tokenは長期的に低価格での競争に頼ることは業界の発展に不利だ」と率直に述べた。1000キロメートル超離れた場所でも、腾讯の上級執行副総裁の湯道生氏と副総裁の李強氏がそれぞれTokenに言及している。前者は「同じモデル能力であっても、異なるHarness(足場)の設計によってTokenのコストは大きく異なる」とし、後者は「Tokenの切り替えは容易だが、粘着性は弱く、補助金を止めれば顧客は簡単に流出する」と考えた。OpenClaw(ネット上のニックネーム「龍蝦(ロブスター)」)らがToken消費を指数関数的に爆発させると、Tokenはもはや単なる技術用語ではなく、ビジネスモデルに関わる重要な変数になった。
Token「コストを燃やし尽くす」
龍蝦が巻き起こしたエージェントの熱狂により、Token消費量は指数関数的に爆発している。Tokenとは何か?国家データ局の定義では、AIの大規模モデルが情報を処理するための最小単位であり、Tokenは測定可能で、価格付け可能で、取引可能だ。
百度千帆プラットフォームのプロダクト責任者である張婷氏は、北京商報の記者に対し次のように説明した。「それは、ある1文字と完全に等しいわけでもなく、ある1語と完全に等しいわけでもなく、2つの間にある一種の『言語断片』です。たとえば漢字の『我(私)』はTokenであり、『今日(きょう)』もTokenかもしれないが、『国際化(インターナショナリゼーション)』は『国際』と『化』の2つのTokenに分解される可能性があります。大規模モデルが扱う言語はグローバルだからです。Tokenは、モデルがあらゆる言語や記号を統一的な方法で処理できる、汎用的な『最大公約数』です」。
国家データ局の発表によると、2024年初めの中国の日次平均Token呼び出し量は1000億だった。2025年末までに100万億へと跳ね上がり、2026年3月にはすでに140万億を突破した。2年間で増加は1000倍超だ。
クラウド事業者とAI大規模モデル企業の反応は2月から始まり、智谱はGLM Coding Planの初回購入の割引を取り消し、パッケージ価格の全体の上昇幅は30%からとなった。3月上旬には、腾讯クラウドが2つの自社開発モデルの価格を引き上げ、そのうちTencent HY2.0 Instructモデルの上昇幅は463%に達した。下旬には阿里雲と百度智能云が同日でAI計算能力の値上げを発表し、最大の上昇幅は34%となった。
エージェントが爆発的に人気になり、その結果Token消費が増大するというロジックの連鎖について、張鹏氏は近日、詳細に説明した。複雑なタスクに直面したとき、Agentは思考のプロセスが長くなり、Token消費量は非常に大きくなる。そのためモデル推論のコストもそれに応じて上がる。だからこそTokenの価格を、正常な商業的価値へと戻す必要がある。長期的に低価格競争に頼ることも、業界全体の発展に不利だ。
北京商報の記者などのメディア取材で、李強氏は次のように述べた。「Tokenの経済性は、すぐにすべての顧客の関心を引くでしょう。もし消費量だけを考えて経済性を考えないなら、ユーザー側の価格やコストはさらに高くなる可能性があり、これは会社の長期的で健全な発展に対してマイナスの影響になります」。
Harness「足場」は水面下に隠れている
Tokenは一体どのように価格付けされるのか?張婷氏は北京商報の記者に対し、例を挙げて分解して説明した。「たとえば『今日の北京の天気はどうですか』という質問に、AIの回答を加えると、おおよそ50〜100個のTokenを消費します。AIに800字の作文を書かせると、あなたのプロンプトと完全な出力を含めて、おおよそ1000〜1500個のToken消費になります」。「お金に換算すると、現在百度千帆プラットフォーム上の主流モデルの価格は、100万Tokenあたり数セント程度です。つまり1元(1ブロック)で、AIに約1000本の800字作文を書かせられるということです」と張婷氏は述べた。
しかし、Token消費量が指数関数的に増えると、より深い問題が浮かび上がってくる。これらのTokenのすべてが「刃先」に使われているわけではないのだ。Tokenはガソリンのようで、Agentは自動車のエンジンのようだ。燃費ばかりを気にして、エンジンの経済性や出力能力を見ないと、最終的に顧客はそれを捨てることになる。李強氏はガソリン消費でTokenの効率を読み解いた。
Nextie(明日新程)の創業者であり、「小冰之父(シャオビンの父)」でもある李笛氏も、北京商報の記者に対して次のように述べた。「Token消費の熱が指し示すのは、面白い現象です。Tokenmaxxing(つまりTokenを刷る量勝負)で、今は多くの開発者や会社がToken消費量を狂ったように刷っており、さらにはそれを一種の『計算能力の筋肉(アピール)』の展示だと見なしています。でも、こうした節度のない燃焼は、巨大なROI(投資回収率)の不均衡をもたらします」。
以上の背景のもと、もう一つの概念であるHarnessは、シリコンバレーと国内の技術コミュニティで急速に注目を集めている。
李笛氏は北京商報の記者に対し、Harnessの直訳は「鞍具」または「手綱(たづな)」だと詳しく説明した。もし大規模モデルが、力は強いが進む方向が定まらない野馬だとするなら、Harnessは、その野馬が定められたレール上を走れるようにする一式の制約システムである。
「AIの実装はアルゴリズムの問題だけでなく、エンジニアリングの問題でもある」と湯道生氏はこの判断を投げかけた。「同じモデル能力のもとで、異なる足場やHarnessの設計、たとえばモデルにどんなツールを呼び出させるか、階層構造を持つコンテキストのエンジニアリング、長期記憶の管理、ワークフローの実現などが、実際の使用効果やTokenコストに大きな影響を与えます」。
MiMo大規模モデルの責任者である羅福莉氏も、OpenClawの価値を解釈する際にこの名詞に触れた。「OpenClawは、国内のあの『セミクローズド』な水準のモデルの上限を非常に高く引き上げると同時に、Harness(制約制御体系)などの一連の設計によって、モデルのタスク完了度と正確率を保証し、下限も十分に担保している」。
クラウド事業者が「土台」を作り直す
具体的にはエンジニアリングの層で、腾讯クラウドのインテリジェント・エージェント開発プラットフォームADPは、RAG(検索強化生成)、ナレッジベースなどの能力によってエージェントを「図書館」につなげ、業界の専門家が常にオンラインでいられるようにする。次にClawはAgent Runtimeの安全サンドボックス上で動作する。Clawはインテリジェントシステムの神経中枢として、スキルバンクから発見しSkillsをダウンロードすることで外部システムと連携する能力を継続的に学習・蓄積し、大規模モデルを用いて対外の指示の受け渡しを行ってアクションを引き起こす。AgentRuntimeのサンドボックス方式は、大規模モデルの強化学習プログラム結果の検証にも使うことができ、強化学習の学習効率を高められる。
これは基盤インフラの氷山の一角にすぎない。
「計算能力の行き着く先は、もしかすると電力だ」と李強氏は取材で明かした。腾讯は2年前から計算と電力の協調(算電協同)を探索し始めた。「協力パートナーとともに内モンゴルで、現地の風力発電と光・蓄エネルギーを用いて直接データセンターへ電力を供給し、さらに水素エネルギーと蓄エネルギーで、クリーンエネルギーのピークと谷をバランスさせる。合わせて計算能力のピーク期とオフピーク期も調整する。これにより一方では電力コストを大幅に下げ、他方では炭素排出量も抑える」。
もう一段階の変化は、調達(ディスパッチ)の仕組みに起きている。「現在のクラウドコンピューティング時代のインフラは、人間のエンジニアをサービスするために設計されており、AIのためではありません。長期的には、インフラは一体のものであるべきで、この一式は自己進化し自己反復でき、自律的な組織を形成できるはずです。つまり、一連のインフラを、認められたCEOが管理するのと同じような形です。それはたぶんClawであり、AIの顧客ニーズに基づいて、自律的に自分のインフラを反復していく可能性があります」と、無问芯穹の共同創業者兼CEOの夏立雪氏は説明した。
注目すべきなのは、現時点で主要クラウド事業者は二重のアイデンティティを持っていることだ。阿里雲、腾讯クラウド、百度智能云はいずれもTokenの供給側であり、同時にTokenの消費側でもある。
阿里雲が最近公表した目標によれば、今後5年で、クラウドとAIの商業化による年収は1000億米ドルを突破する。さらに阿里グループは、従業員にToken枠を提供し、従業員が仕事の中で先進的なAIモデルとツールを使うことを後押しする。
李強氏は「Tokenは確かに腾讯クラウドにとって非常に重要な管理指標の一つだが、Tokenを最優先順位に置いておらず、極端な報奨政策で推進もしない。腾讯はより良いエンジンの研究開発にリソースを振り向け、使いやすいAIプロダクトを提供することで、実際のToken消費を生み出すことを好む」と述べた。2025年に腾讯クラウドは規模化して収益化を達成し、「2026年はあまり攻めすぎたくない」と李強氏は率直に言った。
140万億Tokenが産業を揺さぶるとき、次のラウンドの勝負もすでに始まっている。
北京商報記者 魏蔚
膨大な情報、精密な解説は、Sina Finance APPにお任せください
編集担当:高佳