Perceptron transforme la bande passante inutilisée en données d'entraînement d'IA.

Le secteur de l'intelligence artificielle est actuellement confronté à un grave goulot d'étranglement des données d'entraînement, d'autant plus que les monopoles technologiques centralisés verrouillent l'accès des développeurs débutants aux pipelines d'information de haute qualité. La plateforme de données décentralisée Perceptron tente de remédier à ce goulot d'étranglement structurel en déployant une couche d'infrastructure décentralisée qui collecte des informations web via les appareils des utilisateurs quotidiens.

Résumé

  • Perceptron utilise la bande passante consommateur inutilisée pour collecter des données web publiquement disponibles et fournir des ensembles de données d'entraînement IA à moindre coût.
  • La plateforme affirme que son réseau couvre plus de 150 pays et récompense les contributeurs tout en vérifiant la qualité des données avant qu'elles ne soient fournies aux clients entreprises.
  • Perceptron a lancé un Fonds de Données IA de 10 millions de dollars pour aider les développeurs à accéder à l'infrastructure de données et accélérer le développement de modèles IA.

Les médias modernes se concentrent entièrement sur la manière dont les grands noms du secteur de l'intelligence artificielle déploient constamment des systèmes matériels de nouvelle génération pour renforcer leur puissance de calcul brute. Mais l'une des contraintes opérationnelles les moins évoquées est la qualité des données d'entraînement qui constituent le fondement de tout modèle IA fonctionnel.

Le problème est qu'avec la grande majorité du contenu web ouvert déjà largement récoltée, le contrôle agressif des entreprises sur les interfaces de programmation d'applications publiques a verrouillé les fondations restantes de la collecte d'ensembles de données derrière des murs payants exorbitants de plusieurs millions de dollars. Cela est devenu essentiellement un privilège exclusif prohibitif pour une poignée de grands monopoles technologiques.

Pour les géants de la technologie qui mènent actuellement la course à l'IA, sécuriser ces pipelines d'information à coût élevé n'est pas vraiment un défi financier, mais qu'en est-il des innovateurs sous-financés ? Sans les budgets nécessaires, les startups en phase de démarrage peinent à construire des produits compétitifs.

« OpenAI paie environ 60 à 100 millions de dollars par an à des entreprises comme Reddit et Twitter pour pouvoir accéder aux données via des API », a déclaré Peter Anthony, cofondateur et PDG de Perceptron, lors d'une récente interview avec crypto.news

« De nombreux nouveaux projets IA n'ont pas les budgets nécessaires pour dépenser 60 à 100 millions de dollars pour accéder aux données. Si vous construisez le meilleur modèle du monde, il est assez inutile s'il n'a pas accès à des données de bonne qualité. Vous pouvez être l'élève le plus intelligent de l'école, mais si vous ne pouvez pas accéder à des livres, vous n'avez pas vraiment beaucoup d'informations à présenter. »

Anthony a réalisé que cette asymétrie de marché laisse place à une infrastructure alternative qui servirait le segment de marché indépendant, ce qui l'a finalement conduit à cofonder Perceptron, une plateforme qui prévoit d'utiliser la bande passante consommateur inutilisée pour résoudre « le problème du goulot d'étranglement des données » dont souffre actuellement l'IA.

« La majorité des données mondiales ont déjà été consultées et extraites, mais il y a beaucoup de données qui sont en quelque sorte cachées derrière différents endroits qui ne sont pas encore accessibles, donc nous rassemblons des données et nous nous positionnons pour pouvoir fournir des données aux entreprises IA à un coût réduit », a expliqué Anthony.

Exploiter la bande passante inutilisée

Mais quelle est cette bande passante inutilisée que Perceptron prévoit d'exploiter ? Anthony a expliqué qu'il s'agit de l'actif économique non reconnu que les utilisateurs quotidiens produisent constamment via la navigation numérique de routine, pour ensuite regarder les grandes entreprises l'extraire et en tirer profit.

« Actuellement, chaque fois que vous et moi utilisons internet sur nos téléphones, nos ordinateurs, nous générons des données. Ces données sont collectées, regroupées en ensembles de données massifs par des entreprises comme Google, et vendues pour des millions, parfois des milliards de dollars. Pourtant, vous et moi ne voyons jamais un centime de cette valeur. »

Ce que Perceptron a fait, c'est complètement renverser ce modèle d'extraction. Ils ont construit un réseau couvrant plus de 150 pays comprenant environ 800 000 nœuds, et ces nœuds sont alimentés par des utilisateurs individuels qui exécutent simplement une extension de navigateur sur Chrome ou une application sur leurs appareils Android.

Bien que ces installations de point d'accès ne récupèrent pas de fichiers numériques privés ni ne fournissent à l'entreprise des données personnelles sensibles de télémétrie, elles sécurisent plutôt des perspectives géographiques localisées, ce qu'Anthony a décrit comme des « points de vue différents » sur le web ouvert, qui peuvent ensuite être extraits en petits morceaux et combinés en un seul ensemble de données significatif.

« Il est très important que nous nous concentrions sur le fait qu'il ne s'agit pas d'utiliser les données des individus, il ne s'agit pas de puiser dans vos propres données et informations personnelles, mais disons que vous êtes actuellement au Malawi. Lorsque vous regardez un site web particulier, je pourrais aller voir le même site web, mais il y a des chances, parce que je suis à Dubaï, que nous voyions un ensemble de résultats différents. Tout ce que nous gagnons de cette situation, c'est pouvoir utiliser votre ordinateur pour regarder quelque chose comme une page web normale, ou quoi que ce soit d'autre. »

Pour illustrer, Anthony a noté que si un client corporatif nécessite un ensemble de données de publications sur les réseaux sociaux liées à la santé aux États-Unis, Perceptron peut coordonner sur son réseau de nœuds mondial pour extraire des publications publiques individuelles sans interagir avec les API restrictives des entreprises.

Parce que ces données sont déjà librement accessibles au public via n'importe quel navigateur web standard, aiguiller la collecte à travers des nœuds terminaux individuels contourne légalement les murs payants commerciaux. Une fois ces petits paquets de données récupérés, le réseau transfère les données brutes vers un serveur centralisé où des modèles d'intelligence artificielle spécialisés nettoient et vérifient les informations pour le contrôle qualité.

« En faisant cela, nous pouvons réduire considérablement le coût actuellement facturé par beaucoup de grandes entreprises centralisées comme Google. »

Alimenté par une boucle économique qui incite les participants de qualité au réseau

La question suivante est de savoir pourquoi quiconque voudrait offrir volontairement son matériel à un réseau comme celui-ci, et la réponse est simple : une boucle de valeur partagée garantissant que ces nœuds gagnent des points pour leur connectivité passive, qui devraient être convertis plus tard en jetons cryptographiques natifs.

Selon Anthony, ce modèle distribué « leur permettra de gagner des points » qui agissent comme une mesure directe de leur contribution au réseau, et donc « chaque fois que des revenus sont générés par l'entreprise, des jetons seront réinjectés dans l'écosystème » pour soutenir une boucle économique cyclique.

« Il y aura également des jetons mis de côté qui seront utilisés pour racheter des jetons », a-t-il ajouté.

Cependant, tous ceux qui exploitent un nœud ne sont pas essentiellement éligibles à des récompenses constantes, car il y a le défi toujours présent du contrôle qualité, qui peut compromettre l'intégrité des ensembles de données s'il n'est pas maîtrisé.

Perceptron répond à cela en renvoyant les paquets collectés vers un serveur centralisé, où des algorithmes automatisés évaluent systématiquement les entrées par rapport à des critères de référence cibles avant de libérer toute compensation.

De plus, Anthony a déclaré que la startup a récemment acquis une entreprise spécialisée dans les logiciels de vérification des transactions et des paiements pour automatiser structurellement ce processus de validation.

Pour impliquer davantage les participants au réseau tout en stimulant la création d'ensembles de données, Perceptron prévoit également de lancer une plateforme structurée de Quête de Données, qui permettra aux contributeurs de transformer l'effort humain actif en entrées d'entraînement uniques.

« Nous visons à pouvoir efficacement construire des ensembles de données et créer des ensembles de données qui ne sont actuellement pas disponibles via des processus centralisés », a ajouté Anthony.

L'objectif final

À long terme, Anthony a déclaré qu'il aimerait voir le réseau passer à un modèle axé sur le renseignement d'entreprise, capable de fournir des analyses approfondies pour les clients entreprises.

« La différence est que les ensembles de données traditionnels sont statiques, ils sont collectés une fois et deviennent rapidement obsolètes. Mais une quantité énorme de données est générée chaque fois que vous interagissez avec quoi que ce soit en ligne, et actuellement, la plupart d'entre elles sont simplement gaspillées », a déclaré Anthony.

« Un seul serveur essayant de surveiller tous ces différents utilisateurs ne peut pas vraiment recueillir de renseignements significatifs à cette échelle. Ce dont nous avons besoin, c'est d'un passage vers un renseignement d'entreprise distribué, afin que nous puissions réellement améliorer les services dans des domaines comme le commerce électronique, le trading, et bien plus encore. »

Perceptron a également lancé un Fonds de Données IA de 10 millions de dollars, par le biais duquel la plateforme prévoit de financer des développeurs indépendants et de soutenir le déploiement de « projets réels fournissant des services réels ». Selon les termes du programme, les équipes d'ingénierie sélectionnées reçoivent cinq semaines d'assistance dédiée à l'infrastructure de données et jusqu'à 5 To de données réelles gratuitement pour accélérer l'optimisation des modèles IA en phase de démarrage.

« L'objectif est de soutenir les projets à mesure qu'ils grandissent et que leurs besoins en données augmentent. Nous pouvons devenir l'un de leurs fournisseurs de référence, c'est à la fois un investissement dans l'écosystème plus large et un moyen pour nous de construire des revenus constants à long terme », a noté Anthony.

Au moment de la publication, Anthony a déclaré que Perceptron fournit déjà activement divers produits de données à une variété d'entreprises commerciales. Le réseau fournit des ensembles d'images étendus aux plateformes génératives texte-vers-vidéo, y compris une entreprise appelée Everlyn AI, pour former des modèles à synthétiser avec précision du contenu visuel.

Au-delà de cela, le projet dépasse également la simple compilation d'images standard, car la plateforme est entrée dans le secteur de l'analyse des sentiments en suivant le discours public sur Twitter, YouTube et les marchés d'actifs numériques. Analyser ce sentiment public aide les entreprises et les échanges cryptographiques à construire des outils de suivi qui donnent des signaux précoces pour anticiper les fluctuations soudaines des prix.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé