中央广播テレビ総局北京3月11日付の報道(記者:樊瑞)によると、今年の全国人民代表大会と全国政协会議において、第14期全国政协委員、社会法制委員会委員、知乎創業者兼CEOの周源は、人工知能の大規模モデルとインターネットコンテンツコミュニティに注目し、データの秩序ある流通を促進する仕組みの構築を提案した。周源は、現在のデータ整備は行政データや公共データセットに偏っており、インターネット空間に長期間蓄積された高品質な専門コンテンツは十分に重視されていないと指摘した。実際、技術、医療、法律、金融などの分野の専門コンテンツコミュニティには、多くの専門家や実務者が継続的に生産する知識型コンテンツが集まっており、専門性が高く、意味内容が豊富で、実践的な密度も高い。これらは、大規模モデルが複雑な問題を理解し、高品質な意思決定を支えるための重要なデータ源である。「インターネットの専門コンテンツの秩序ある流通と適法な利用の仕組みを早急に確立しなければ、創作者の権益に影響を及ぼすだけでなく、中国のAI産業の長期的な競争力も制約されることになる」と周源は述べ、戦略レベルからこの重要な环节の突破を推進すべきだと強調した。彼は、インターネットコンテンツコミュニティが標準APIインターフェースを通じて大規模モデルにデータサービスを開放することを支援すべきだと考えている。現在、一部のAI企業はクローラーを用いて無許可でネット上のコンテンツを収集しており、著作権紛争が頻発し、データの合法性に疑問が生じている。プラットフォーム側と創作者の権益保護も難しく、モデル企業も訴訟やコンプライアンス違反のリスクに直面している。これにより、業界の潜在的な制度コストが実質的に高まっている。周源は、業界主管部門がインターネットコンテンツコミュニティの標準化されたAPIによるリアルタイムデータサービス体系を政策支援の範囲に含め、データ要素の秩序ある流通の重要な部分とすべきだと提言している。また、周源は、関連企業が高品質な専門家データのラベリング業務を展開・支援することも奨励すべきだと述べた。大規模モデルの競争が深みにはまる中、データの「質」が「規模」よりも重要になっている。コンテンツコミュニティが人材集積の優位性を発揮し、専門家レベルのラベリングやコンテンツ評価サービスを提供することを支援すべきだ。さらに、「専門家データ資産化」の試験運用を行い、研究開発投資や人材補助金などの政策的優遇措置を講じることも提案している。さらに、インターネットコンテンツプラットフォームが重点分野の専門コーパスのオープンソース・オープンプラットフォームの構築に参加することも支援できる。国際的なオープンソースプラットフォームは、「モデル—データ—評価」の協調エコシステムと成熟したオープンソースライセンス体系を構築し、世界中の開発者資源を集約しており、人工知能産業の重要なデータ基盤となっている。周源は、業界主管部門の指導の下、インターネットコンテンツコミュニティと業界団体、研究機関が共同で重点分野向けの専門コーパスのオープンソース・オープンプラットフォームを構築し、「コミュニティ生産—プラットフォーム運営—モデルフィードバック—継続的最適化」の良性循環を形成し、インターネットコンテンツコミュニティに蓄積された専門知識資源を適法かつ安定的で持続可能な大規模モデル訓練データ源に変換し、中国のAI産業のデータ基盤を強化すべきだと考えている。
全国政协委员周源:应促进インターネットコンテンツコミュニティデータの有序な流通
中央广播テレビ総局北京3月11日付の報道(記者:樊瑞)によると、今年の全国人民代表大会と全国政协会議において、第14期全国政协委員、社会法制委員会委員、知乎創業者兼CEOの周源は、人工知能の大規模モデルとインターネットコンテンツコミュニティに注目し、データの秩序ある流通を促進する仕組みの構築を提案した。
周源は、現在のデータ整備は行政データや公共データセットに偏っており、インターネット空間に長期間蓄積された高品質な専門コンテンツは十分に重視されていないと指摘した。実際、技術、医療、法律、金融などの分野の専門コンテンツコミュニティには、多くの専門家や実務者が継続的に生産する知識型コンテンツが集まっており、専門性が高く、意味内容が豊富で、実践的な密度も高い。これらは、大規模モデルが複雑な問題を理解し、高品質な意思決定を支えるための重要なデータ源である。
「インターネットの専門コンテンツの秩序ある流通と適法な利用の仕組みを早急に確立しなければ、創作者の権益に影響を及ぼすだけでなく、中国のAI産業の長期的な競争力も制約されることになる」と周源は述べ、戦略レベルからこの重要な环节の突破を推進すべきだと強調した。
彼は、インターネットコンテンツコミュニティが標準APIインターフェースを通じて大規模モデルにデータサービスを開放することを支援すべきだと考えている。現在、一部のAI企業はクローラーを用いて無許可でネット上のコンテンツを収集しており、著作権紛争が頻発し、データの合法性に疑問が生じている。プラットフォーム側と創作者の権益保護も難しく、モデル企業も訴訟やコンプライアンス違反のリスクに直面している。これにより、業界の潜在的な制度コストが実質的に高まっている。周源は、業界主管部門がインターネットコンテンツコミュニティの標準化されたAPIによるリアルタイムデータサービス体系を政策支援の範囲に含め、データ要素の秩序ある流通の重要な部分とすべきだと提言している。
また、周源は、関連企業が高品質な専門家データのラベリング業務を展開・支援することも奨励すべきだと述べた。大規模モデルの競争が深みにはまる中、データの「質」が「規模」よりも重要になっている。コンテンツコミュニティが人材集積の優位性を発揮し、専門家レベルのラベリングやコンテンツ評価サービスを提供することを支援すべきだ。さらに、「専門家データ資産化」の試験運用を行い、研究開発投資や人材補助金などの政策的優遇措置を講じることも提案している。
さらに、インターネットコンテンツプラットフォームが重点分野の専門コーパスのオープンソース・オープンプラットフォームの構築に参加することも支援できる。国際的なオープンソースプラットフォームは、「モデル—データ—評価」の協調エコシステムと成熟したオープンソースライセンス体系を構築し、世界中の開発者資源を集約しており、人工知能産業の重要なデータ基盤となっている。周源は、業界主管部門の指導の下、インターネットコンテンツコミュニティと業界団体、研究機関が共同で重点分野向けの専門コーパスのオープンソース・オープンプラットフォームを構築し、「コミュニティ生産—プラットフォーム運営—モデルフィードバック—継続的最適化」の良性循環を形成し、インターネットコンテンツコミュニティに蓄積された専門知識資源を適法かつ安定的で持続可能な大規模モデル訓練データ源に変換し、中国のAI産業のデータ基盤を強化すべきだと考えている。