国家データ局:2025年末までに全国で構築された高品質データセットは10万を超え、中国国家図書館のデジタル資源総量の約310倍に相当します。

robot
概要作成中

毎日新聞記者|周逸斐    毎日新聞編集|毕陆名

3月24日、国務院新聞弁公室が記者会見を行い、第9回デジタル中国建設サミットに関する状況を説明した。

国家データ局局長の劉烈宏は会場で、「本年3月時点で、わが国の1日当たりのToken(トークン)の呼び出し量は、すでに140万億を超えた。2024年初めの1000億からは1000倍以上の伸びとなり、2025年末の100万億と比べても、わずか3か月でさらに40%以上増加した。1日当たりのToken呼び出し量の大幅な増加は、中国の人工知能発展が急速な成長段階に入ったことを十分に示している」と述べた。

画像出典:毎日新聞記者周逸斐 現場撮影

本年3月時点で、わが国の1日当たりのToken呼び出し量は、2024年初めの1000億から1000倍以上の伸び

日常のスマートアシスタント、産業側のスマート分析などには、大量の高品質データが欠かせない。国家データ局は、高品質データセットを通じた人工知能発展への賦能を推進するにあたり、どのような取り組みを行っているのか。さらに、今後どのような計画があるのか?

劉烈宏は、「国家データ局は、データ要素が人工知能の革新的発展を担う取り組みを非常に重視している。高品質データセット整備における『小規模で分散している』という課題に対応し、26の部門と連携して、72の高品質データセット整備のチェーンリーダー(牽引役)ユニット、140の先行先試の業務実施ユニット、104の典型事例を選定し、チェーンリーダーが牽引し、多方面が参加し、共同で技術課題に取り組み、共同で建設・共有し、協力してウィンウィンを実現するという高品質データセット整備のエコシステムを構築し、引き続き高品質データセットの整備を推進している」と述べた。

データラベリング産業の発展を促すため、国家データ局は、成都、瀋陽、合肥、長沙、海口、保定、大同の7つの、市がデータラベリング先行先試の整備業務を担うよう配置し、『データラベリング産業の高品質発展を促進するための実施意見』を打ち出した。さらに、47のデータラベリングの優れた事例を選定し、データラベリングの需給マッチング会を7回開催するよう指導した。次の段階では国家データ局は、科技イノベーションが強く、発展の基盤が整い、産業の特色がある地域を対象に、「知識集約型」と「技術主導型」という2つの方向性に焦点を当て、技術的に実現可能で、実用的で便利、品質を保証できるデータラベリング産業の革新的な実証試験区を段階的に配置していく。

劉烈宏はさらに、「国家データ局はまた、『高品質データに対して支払いを行う』という市場での共通認識を引き続き醸成し、業界における高品質データセットをデータ取引所に上場、掲載、取引できるよう推進している。データ流通サービスプラットフォーム、データ業者などの機関が、流通取引のサービスを提供することを支援し、あらゆる種類のデータ流通サービス機関が多様な高品質データセットの流通・利用モデルを模索することを奨励し、高品質データセットの需給を秩序立ってマッチングさせ、高品質データセットが業界内で流通することを支援している」と指摘した。

わが国の高品質データセット整備は、段階的な成果を収めている。2025年末までに、全国で整備された高品質データセットは10万件を超え、総量は890PB(コンピュータの記憶容量の単位)を上回っており、中国国家図書館のデジタル資源総量の約310倍に相当する。本年3月時点で、わが国の1日当たりのToken呼び出し量はすでに140万億を超え、2024年初めの1000億から1000倍以上の伸びとなった。2025年末の100万億と比べても、わずか3か月でさらに40%以上増加した。

「1日当たりのToken呼び出し量の大幅な増加は、中国の人工知能発展が急速な成長段階に入り、応用シーンが絶えず深化していることを十分に示している。対話できるだけでなく、意思決定や実行まで可能な“エージェント”へと拡がっており、中国の人工知能産業の競争力も著しく強化されている。いま熱く議論されているTokenの海外展開は、産業競争力が強化されてきたことの一つの表れである。データの観点から見ても、大量にデータセットの供給が増えており、データ要素の価値が絶えず解放され、データ要素が人工知能の革新的発展を賦能することが、良性の相互作用の段階に入っていることを意味している」と劉烈宏は説明した。

劉烈宏はさらに、「次の段階では、国家データ局は引き続き、データ賦能による人工知能の革新的発展を推進し、関係各方面と協働して、新たな一輪の高品質データセット整備アクションプランを深く実施する。具体的には、基盤強化・増強、ラベリングの攻略、品質の向上と効率化、応用の賦能、管理サービス、価値の解放の6つの重点専門行動を含む。シーンの需要を牽引として、先行先試の取り組みを加速し、技術的に実現可能で、実用的かつ手軽で、品質が保証できるAI-Ready(AI就Ready度)の高品質データセットを構築し、高品質データセット供給の量と質の向上を実現する」と強調した。

データ要素が新型工業化を賦能する政策文書の制定を推進

『毎日経済新聞』の記者も、近日、工業・情報化部が通知を出し、工業データの基礎固め行動を開始し、人工知能の賦能に向けた高品質な業界データセット整備の先行先試を展開していることに注目した。今後、どのようにさらに推進していくのか?

工業・情報化部情報技術開発司の司長、王彦青は、「次の段階で、先行先試の業務を適切に行うため、工業・情報化部は引き続き3つの面で取り組まなければならない。第一に、支援・保障を強化すること。地方の工業・情報化およびデータ主管部門と連携し、先行先試の連合体に対する資源の保障と指導支援を行い、遭遇する問題についてタイムリーにフォローして解決し、経験を集約して、普及可能な成果を早く形成する。

第二に、政策による誘導を強化すること。データ要素が新型工業化を賦能する政策文書の制定を推進し、工業シーンにおけるデータ要素の活用に関する参考指針を発行し、発展の誘導とモデルの紹介を強化する。

第三に、良好なエコシステムを育成すること。工業データ標準の研究開発を加速し、データコンサルティング、データガバナンス、データラベリングなどのデータサービス企業を育てて拡大させる。技術討論会、需給マッチング会などの開催を支援すると同時に、人工知能のオープンソース・コミュニティを強く、良く構築し、高品質のオープンデータ資源が集積する拠点を作る。特に今年、間もなく開催されるサミットでは、工業・情報化部もデータ要素が新型工業化を賦能することに関する特別会議を主催し、先行先試のユニットの代表者に、いくつかの経験を共有してもらう。また、2026年のデータ要素が新型工業化を賦能する大会も開始する」と述べた。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.27K保有者数:2
    0.00%
  • 時価総額:$2.37K保有者数:2
    1.04%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$2.25K保有者数:1
    0.00%
  • ピン