国家データ局:2025年末までに全国で構築された高品質データセットは10万を超え、中国国家図書館のデジタル資源総量の約310倍に相当します。

robot
概要作成中

毎経記者|周逸斐    毎経編集|畢陸名

3月24日、国新辦は第9回デジタル中国建設峰会に関する状況を紹介する記者会見を開催した。

国家データ局局長の劉烈宏は現地で、今年3月までに我が国の日平均Token(トークン)の呼び出し量が、すでに140兆を超えたと述べた。2024年初頭の1000億から1000倍以上増加し、2025年末の100兆と比較しても、3ヶ月で40%以上増加した。日平均Token呼び出し量の大幅な増加は、中国の人工知能の発展が急成長段階に入ったことを十分に示している。

画像出典:毎経記者周逸斐 現場撮影

今年3月までに我が国の日平均Token呼び出し量は2024年初頭の1000億から1000倍以上増加

日常のスマートアシスタントや産業端のスマート分析などは、大量の高品質データを支えにしている。国家データ局は高品質データセットを通じて人工知能の発展を促進するためにどのような取り組みを行い、今後はどのような計画があるのか?

劉烈宏は、国家データ局がデータ要素を活用した人工知能の革新発展を重視しており、高品質データセットの構築における「小さく散らばった」問題に対処するため、26の部門と連携し、72の高品質データセット構築のリーダー企業、140の先行先試作業所、104の典型的なケースを選定し、リーダー主導、多方参加、共同での攻撃、共同構築・共有・協力でのウィンウィンな高品質データセット構築エコシステムを構築したと述べた。高品質データセットの構築を継続的に推進している。

データラベリング産業の発展を促進するために、国家データ局は成都、沈陽、合肥、長沙、海口、保定、大同の7つの都市をデータラベリングの先行先試の建設任務を担当させるために配置し、「データラベリング産業の高品質発展を促進するための実施意見」を発表し、47の優れたデータラベリング事例を選定し、7回のデータラベリングの供給と需要のマッチング会を開催した。今後、国家データ局は、科学技術革新が強く、発展基盤が良好で、産業の特色が優れた地域を対象に、「知識集約型」と「技術駆動型」という2つの方向に焦点を当て、高度な技術を持ち、特色が明確で、高効率でデータラベリング産業の革新実験区を段階的に配置する。

劉烈宏はさらに、国家データ局が「高品質データに対して支払う」という市場の合意を持続的に育成し、業界の高品質データセットをデータ交易所に上場、出品、取引することを促進していると述べた。データ流通サービスプラットフォームやデータ商などの機関が流通取引のサービスを提供することを支援し、各種データ流通サービス機関が多様な高品質データセット流通利用モデルを探求することを奨励し、高品質データセットの供給と需要の秩序あるマッチングを促進し、業界の高品質データセットが流動することを支援している。

我が国の高品質データセットの構築作業は段階的な成果を上げており、2025年末までに全国で構築された高品質データセットは10万を超え、総量は890PB(コンピュータストレージ容量の単位)を超え、中国国立図書館のデジタル資源総量の約310倍に相当する。今年3月までに我が国の日平均Tokenの呼び出し量は、すでに140兆を超え、2024年初頭の1000億から1000倍以上増加し、2025年末の100兆と比較しても、3ヶ月で40%以上増加した。

「日平均Token呼び出し量の大幅な増加は、中国の人工知能の発展が急成長段階に入ったことを十分に示しており、応用シーンが深化し続けている。対話ができるから実行する意思決定ができるインテリジェントエージェントへと進化し、中国の人工知能産業の競争力も著しく向上している。今熱議されているTokenの海外進出は、産業競争力の向上の一つの象徴である。データの視点から見ても、データセットの供給が大幅に増加しており、データ要素の価値が不断に解放され、データ要素が人工知能の革新発展を促進する良好な相互作用の段階に入ったことを示している。」と劉烈宏は紹介した。

劉烈宏は強調した。次のステップとして、国家データ局はデータを活用した人工知能の革新発展を持続的に推進し、各方面と協力し、新たな高品質データセット構築行動計画を深く実施することを目指しており、基盤強化、拡張、ラベリングの強化、質の向上、応用の強化、管理サービス、価値の解放という6つの特別な行動を含む。シーンの需要を牽引として、先行先試の作業を加速し、技術的に実行可能で、便利で、品質が保証されたAI-Ready(AI準備度)の高品質データセットを構築し、高品質データセットの供給の量質向上を実現する。

データ要素を活用した新型工業化の政策文書の発表を推進する

《毎経新聞》記者は最近、工業と情報化部が通知を発行し、工業データ基盤構築行動を開始し、人工知能を活用した高品質業界データセットの構築の先行先試を行うことを注意した。今後、どのようにさらに推進していくのか?

工業と情報化部情報技術発展司司長の王彦青は、次のステップとして、先行先試の作業を円滑に進めるために、工業と情報化部が3つの側面で取り組む必要があると述べた。第一に、支援保障を強化すること。地方の工業と情報化およびデータ主管部門と連携し、先行先試の共同体のリソース保障と指導支援を行い、問題が発生した際には迅速にフォローアップし、経験を集約し、推進可能な成果を形成すること。

第二に、政策の指導を強化すること。データ要素を活用した新型工業化の政策文書を発表し、工業シーンにおけるデータ要素の応用参考指針を発行し、発展の指導とモデルの普及を強化すること。

第三に、良好なエコシステムを育成すること。工業データ標準の策定を加速し、データコンサルティング、データガバナンス、データラベリングなどのデータサービス企業を育成・拡大し、一連の技術セミナーや供給と需要のマッチング会を開催することを支援し、人工知能のオープンソースコミュニティを強化し、高品質のオープンデータリソースの集積地を構築すること。特に、今年の開催予定の峰会では、工業と情報化部もデータ要素を活用した新型工業化に関する特別会議を主催し、先行先試の代表者を招待して経験を共有する。また、2026年のデータ要素を活用した新型工業化に関する大会も開始する予定である。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン