Les appels d'ontologie pour la vérification humaine dans les données d'entraînement de l'IA sans sacrifier la vie privée

Ontology attire l'attention sur un problème croissant dans le monde de l'IA : comment prouver qu'une donnée d'entraînement provient d'une personne réelle sans transformer tout le processus en cauchemar pour la vie privée ?

Dans un article récent, le projet a soutenu que la réponse ne devrait pas être plus de surveillance. Au lieu de demander aux contributeurs de remettre des selfies, des pièces d'identité, des scans biométriques et d'autres détails personnels, Ontology affirme que l'industrie devrait s'appuyer sur des credentials vérifiables et la divulgation sélective afin que les gens puissent prouver qu'ils sont humains sans tout révéler d'eux-mêmes.

Cette idée est plus importante aujourd'hui qu'il y a un an. La conversation sur les données d'entraînement de l'IA a clairement évolué. Il s'agissait auparavant principalement d'échelle, de volume et de la quantité de données pouvant être collectées. Maintenant, la question plus cruciale est d'où proviennent ces données, si elles sont réellement humaines, et dans quelle mesure elles ont déjà été polluées par du contenu synthétique.

Cette préoccupation n'est plus une question marginale. Elle est devenue l'une des plus grandes migraines pour les équipes d'IA qui cherchent à construire des modèles plus propres et plus fiables. Ontology affirme que le marché commence déjà à traiter la preuve de la personhood comme un actif précieux. Les données humaines vérifiées deviennent quelque chose pour lequel les entreprises pourraient devoir payer un supplément.

La demande augmente, mais l'offre est limitée, et la manière dont de nombreuses plateformes envisagent de vérifier les personnes est, selon leur point de vue, profondément défectueuse. Le chemin le plus simple pour la plupart des plateformes est aussi le plus invasif.

Si elles veulent savoir si quelqu'un est humain, elles demandent généralement de plus en plus d'informations personnelles. Elles peuvent exiger un selfie, une pièce d'identité gouvernementale, une vérification de vivacité, un suivi comportemental, une empreinte de l'appareil, ou une combinaison de tout cela.

Chaque couche peut rendre la vérification plus fiable, mais cela signifie aussi que l'utilisateur renonce à plus de vie privée. Avec le temps, la personne qui tente de prouver qu'elle est réelle se décompose en un ensemble de points de données stockés sur les systèmes de quelqu'un d'autre. Ontology soutient que c'est le mauvais compromis.

L'entreprise affirme que le problème n'est pas que les gens doivent être vérifiés. Le problème est que le modèle actuel suppose que la vérification doit s'accompagner d'une exposition permanente. C'est ce qui se produit lorsque l'industrie utilise des outils centralisés conçus pour collecter autant de données que possible. En pratique, l'humain devient le coût de la confiance.

La véritable avancée

L'alternative qu'Ontology propose repose sur le Modèle de Données des Credentials Vérifiables du W3C 2.0, annoncé comme une Recommandation en mai 2025. L'idée est assez simple, même si la cryptographie qui la sous-tend ne l'est pas : un émetteur de confiance, comme un gouvernement, une banque ou un fournisseur de vérification, peut confirmer quelque chose à propos d'une personne une seule fois, et ce credential peut résider sur le propre appareil de l'utilisateur.

Lorsqu'une plateforme doit plus tard savoir si cette personne est humaine, l'utilisateur peut présenter une preuve cryptographique au lieu de remettre tout le dossier sous-jacent. Cela signifie que le vérificateur obtient ce dont il a besoin, et rien de plus.

Il apprend qu'un émetteur de confiance a confirmé que la personne est humaine. Il ne voit pas le fichier d'identité complet de la personne, ses données biométriques ou d'autres détails supplémentaires. L'émetteur n'a pas besoin d'être contacté à chaque utilisation du credential, et l'utilisateur ne laisse pas une trace d'identifiants liés à travers différentes plateformes.

Ontology affirme que la véritable avancée ici est la divulgation sélective. C'est ce qui rend le système véritablement respectueux de la vie privée. Un credential peut contenir beaucoup d'informations, mais l'utilisateur ne révèle que les parties qui comptent pour la demande spécifique. Donc, si une plateforme a seulement besoin d'une preuve de la personhood, elle obtient exactement cela et rien d'autre.

Pas de données personnelles supplémentaires, pas de biométrie, pas de fragments de profil réutilisables qui pourraient être assemblés plus tard. La société a également souligné ses propres travaux en identité décentralisée, notamment ONT ID et le portefeuille ONTO, comme exemples de cette approche en pratique.

Selon Ontology, ces outils sont conçus pour garder les credentials sur l'appareil et permettre aux utilisateurs de générer des preuves localement, sans exposer leurs données privées aux émetteurs ou vérificateurs. Le point plus large, cependant, ne concerne pas seulement Ontology. Il concerne la direction que prend l'infrastructure de l'IA.

Alors que les entreprises s'efforcent de nettoyer leurs données d'entraînement et de déterminer ce qui peut encore être digne de confiance, la pression pour vérifier les contributeurs humains ne fera que croître. La vraie question est de savoir si l'industrie résout ce problème en intégrant plus de surveillance dans la pile, ou en utilisant des systèmes qui permettent aux gens de prouver qu'ils sont réels sans renoncer à leur vie privée dans le processus.

Ontology mise clairement sur la deuxième option. Et avec les entreprises d'IA qui s'inquiètent désormais plus de la provenance que de la quantité brute, cette mise pourrait commencer à ressembler moins à un argument marginal sur la vie privée et plus à une exigence pratique pour la prochaine phase de collecte de données d'IA.

ONT4,56%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé