国家データ局:2025年末までに全国で構築された高品質データセットは10万を超え、中国国家図書館のデジタル資源総量の約310倍に相当します。

robot
概要作成中

毎日経済新聞記者|周逸斐 毎日経済新聞編集|畢陸名

3月24日、国務院情報弁公室(国新弁)が記者会見を行い、第9回デジタル中国建設峰会に関する状況を説明した。

国家データ局局長の劉烈宏氏は会場で、「今年3月までに、わが国の日次平均Token(トークン)の呼び出し量は、すでに140万億を超えた。2024年初頭の1000億から1000倍以上の伸びであり、2025年末の100万億と比べても、3か月の間にさらに40%以上増加している。日次平均Token呼び出し量の大幅な増加は、中国の人工知能(AI)発展が急速な成長段階に入ったことを十分に示している」と述べた。

画像出典:毎日経済新聞記者周逸斐 現場で撮影

今年3月時点で、わが国の日次平均Token呼び出し量は、2024年初頭の1000億から1000倍以上増加している

日常のスマートアシスタントや産業側のスマート分析などには、大量で高品質なデータが不可欠である。国家データ局は、高品質データセットが人工知能発展に力を与えることを推進するうえで、どのような取り組みを行ってきたのか。さらに、今後どのような手配があるのか?

劉烈宏氏は、「国家データ局は、データ要素が人工知能の革新的発展に力を与える取り組みを非常に重視している。高品質データセットの整備における“規模が小さく分散している”という課題に対して、26の部門とともに、高品質データセット整備のチェーン主(チェーンリーダー)となる72の主要ユニット、先行先試の業務を担う140のユニット、そして104の典型事例を選定し、チェーン主が牽引し、複数者が参加し、共同で課題を攻略し、共同で建設し、共同で共有し、相互に利益を得るという高品質データセット整備の生態系を構築し、継続的に高品質データセットの整備を推進している」と述べた。

データ・アノテーション(ラベリング)産業の発展を促すため、国家データ局は、成都、瀋陽、合肥、長沙、海口、保定、大同の7都市に対し、データ・アノテーションの先行先試の整備タスクを担わせる配置を行い、「データ・アノテーション産業の高品質発展を促進するための実施意見」を公布した。47のデータ・アノテーション優秀事例を選定し、7回のデータ・アノテーションの需給マッチング会の開催を指導した。次の段階では、科技イノベーション力が強く、発展の基盤が良好で、産業の特色がある地域に対して、「知識集約型」と「技術駆動型」という2つの方向性に焦点を当て、技術が先進的で、特色が鮮明で、高効率で力を与えられるデータ・アノテーション産業のイノベーション実証試験区を段階的に配置する方針だ。

劉烈宏氏はさらに、「国家データ局はまた、“高品質データに対して支払いを行う”という市場の共通認識を継続的に育成し、業界の高品質データセットがデータ取引所で掲出・アップロード・取引されることを推進している。データ流通サービスプラットフォームやデータ業者などの機関に対し、流通取引のサービス提供を支援し、各種のデータ流通サービス機関に対して、多様な高品質データセットの流通・利用モデルを模索することを奨励し、高品質データセットの需給が秩序立ってマッチングすることを後押しし、業界の高品質データセットが流動し始めることを支援している」と指摘した。

わが国の高品質データセット整備は段階的な成果を上げており、2025年末までに、全国で整備済みの高品質データセットは10万件を超え、総量は890PB(コンピュータのストレージ容量単位)を超えている。これは、中国の国家図書館のデジタル資源の総量の約310倍に相当する。今年3月時点で、わが国の日次平均Tokenの呼び出し量はすでに140万億を超えており、2024年初頭の1000億から1000倍以上増加している。2025年末の100万億と比べても、3か月の間にさらに40%以上増加している。

「日次平均Token呼び出し量の大量な増加は、中国の人工知能の発展が急速な成長段階に入り、アプリケーションのシーンが不断に深化していることを十分に示している。会話ができるだけでなく、意思決定や実行までできるスマートエージェントへと進み、中国の人工知能産業の競争力も顕著に強化されている。今、熱く議論されているTokenの“海外展開(出海)”は、こうした産業競争力の強化の一つの表れでもある。データの観点から見ると、データセットの供給が大量に増えており、データ要素の価値が不断に解放されており、データ要素が人工知能の革新的発展に力を与えることが、良性の相互作用の段階に入ったことも意味している」と劉烈宏氏は紹介した。

劉烈宏氏は次のように強調した。「次の段階では、国家データ局は、データが人工知能の革新的発展に力を与えることを引き続き推進し、関係各方面と協同して、次の一連の高品質データセット建設アクションプランを深く実施していく。具体的には、基盤強化・増容、ラベリングの攻略、品質向上・効率化、アプリケーションによる支援、管理・サービス、価値の解放という6つの重点分野の特別アクションを含む。シーン(ユースケース)の需要を牽引役として、先行先試の取り組みを加速し、技術的に実現可能で、実用的で手軽で、品質を保証できるAI-Ready(AI準備度)の高品質データセットを構築し、高品質データセットの供給における量と質の向上を実現する。」

データ要素が新型工業化に力を与えるための政策文書の策定を後押し

《毎日経済新聞》の記者は、同様に最近、工業・情報化部が通知を発出し、「工業データ筑基(礎を築く)行動」を開始し、人工知能への賦能を目的とする高品質な業界データセット整備の先行先試を実施することにも注目した。今後、どのようにさらに推進するのか?

工業・情報化部 情報技術発展司司長の王彦青氏は、「次の段階では、先行先試の作業をうまく行うため、工業・情報化部は引き続き3つの面で取り組む必要がある。第一に、支援・保障を強化すること。地方の工信(工業・情報化)部門およびデータ主管部門と連携し、先行先試の連合体に対する資源面の保障と指導支援を行い、発生する問題をタイムリーにフォローして解決し、経験を集約し、普及可能な成果を形成するのを加速すること。

第二に、政策誘導を強化すること。データ要素が新型工業化に力を与えるための政策文書の公布を推進し、「工業シーンにおけるデータ要素の活用に関する参考指針」を印刷・発行し、発展の方向づけとモデルの宣伝・紹介を強化する。

第三に、良好なエコシステムを育成すること。工業データの標準の研究開発を加速し、データコンサルティング、データガバナンス、データ・アノテーションなどのデータサービス企業を発展させて拡大し、技術研究討論会、需給対接会などの開催を支援する。同時に、人工知能のオープンソース・コミュニティを強化し、最適化し、高品質なオープンソース・データ資源が集積する拠点を作り上げること。特に今年、間もなく開催される峰会では、工業・情報化部もデータ要素が新型工業化に力を与えることに関する特別会議を主催し、先行先試のユニットの代表者を招いて、いくつかの経験を共有する。また、2026年のデータ要素が新型工業化に力を与えるための大会も開始する」と述べた。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.27K保有者数:2
    0.00%
  • 時価総額:$2.37K保有者数:2
    1.04%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$2.25K保有者数:1
    0.00%
  • ピン