Perceptron está convirtiendo el ancho de banda inactivo en datos de entrenamiento de IA.

El sector de la inteligencia artificial actualmente enfrenta un grave cuello de botella en los datos de entrenamiento, especialmente porque los monopolios tecnológicos centralizados están excluyendo a los desarrolladores en etapa inicial de los conductos de información de alta calidad. La plataforma de datos descentralizados Perceptron está tratando de abordar este cuello de botella estructural implementando una capa de infraestructura descentralizada que recopila información web a través de dispositivos de usuarios cotidianos.

Resumen

  • Perceptron está utilizando el ancho de banda inactivo de los consumidores para recopilar datos web disponibles públicamente y proporcionar conjuntos de datos de entrenamiento de IA a menor costo.
  • La plataforma dice que su red abarca más de 150 países y recompensa a los contribuyentes mientras verifica la calidad de los datos antes de que sean suministrados a clientes empresariales.
  • Perceptron ha lanzado un Fondo de Datos de IA de $10 millones para ayudar a los desarrolladores a acceder a la infraestructura de datos y acelerar el desarrollo de modelos de IA.

Los medios de comunicación modernos se centran por completo en destacar cómo los nombres líderes en el espacio de la inteligencia artificial están desplegando constantemente sistemas de hardware de última generación para aumentar su potencia informática bruta. Pero una de las restricciones operativas menos comentadas es la calidad de los datos de entrenamiento que constituyen la base fundamental de cualquier modelo de IA funcional.

El problema es que, con la gran mayoría del contenido web abierto ya completamente cosechado, el control corporativo agresivo sobre las interfaces de programación de aplicaciones públicas ha bloqueado los fundamentos restantes de la recolección de conjuntos de datos detrás de muros de pago multimillonarios exorbitantes. Se ha convertido esencialmente en un privilegio exclusivo prohibitivamente caro para un puñado de gigantes tecnológicos monopolistas.

Para los gigantes tecnológicos que actualmente lideran la carrera de la IA, asegurar estos costosos conductos de información no es un gran desafío financiero, pero ¿qué pasa con los innovadores con fondos insuficientes? Sin los presupuestos necesarios, las startups en etapa inicial luchan por construir productos competitivos.

"OpenAI paga aproximadamente entre $60 millones y $100 millones por año a empresas como Reddit y Twitter para poder acceder a datos a través de API", dijo a crypto.news Peter Anthony, cofundador y CEO de Perceptron, durante una entrevista reciente.

"Muchos nuevos proyectos de IA por ahí no tienen presupuestos para poder gastar $60 millones a $100 millones para poder acceder a datos. Si construyes el mejor modelo del mundo, es bastante inútil si no tiene acceso a datos de buena calidad. Podrías ser el niño más inteligente de la escuela, pero si no puedes acceder a ningún libro, realmente no tienes mucha información que presentar."

Anthony se dio cuenta de que esta asimetría del mercado deja espacio para una infraestructura alternativa que sirviera al segmento del mercado independiente, lo que finalmente lo llevó a cofundar Perceptron, una plataforma que planea usar el ancho de banda inactivo del consumidor para resolver "el problema del cuello de botella de datos" del que sufre la IA en este momento.

"La mayoría de los datos del mundo ya han sido accedidos y extraídos, pero hay muchos datos que están como ocultos detrás de diferentes lugares que aún no son accesibles, así que estamos recopilando datos y posicionándonos para poder proporcionar datos a empresas de IA a un costo reducido", explicó Anthony.

Cosechando el ancho de banda inactivo

Pero, ¿qué es este ancho de banda inactivo que Perceptron planea aprovechar? Anthony explicó que este es el activo económico no reconocido que los usuarios cotidianos producen constantemente a través de la navegación digital rutinaria, solo para ver cómo las grandes corporaciones lo extraen y se benefician de él.

"Ahora mismo, cada vez que tú y yo usamos Internet en nuestros teléfonos, nuestras computadoras, estamos generando datos. Esos datos se recopilan, se empaquetan en conjuntos de datos masivos por empresas como Google y se venden por millones, a veces miles de millones de dólares. Sin embargo, tú y yo nunca vemos un centavo de ese valor."

Lo que Perceptron ha hecho es darle la vuelta completamente a este modelo extractivo. Han construido una red que abarca más de 150 países que comprende aproximadamente 800,000 nodos, y estos nodos están impulsados por usuarios individuales que simplemente ejecutan una extensión del navegador en Chrome o una aplicación en sus dispositivos Android.

Si bien estas instalaciones de punto final no extraen archivos digitales privados ni proporcionan a la empresa telemetría personal sensible, en su lugar aseguran perspectivas geográficas localizadas, que Anthony describió como "diferentes puntos de vista" en la web abierta, que luego pueden extraerse en pequeñas piezas y combinarse en un conjunto de datos significativo.

"Es muy importante que nos enfoquemos en el hecho de que no está utilizando los datos de los individuos, no está accediendo a tus propios datos e información personal, pero digamos que ahora mismo estás en Malawi. Cuando miras un sitio web en particular, yo podría ir y mirar el mismo sitio web, pero es probable que, como estoy en Dubái, veamos un tipo diferente de conjunto de resultados. Todo lo que estamos ganando de esta situación es poder usar tu computadora para mirar algo como una página web normal, o lo que sea."

Para ilustrar, Anthony señaló que si un cliente corporativo requiere un conjunto de datos de publicaciones de redes sociales relacionadas con la atención médica de EE. UU., Perceptron puede coordinarse a través de su malla global de nodos para extraer publicaciones públicas individuales sin interactuar con API empresariales restrictivas.

Debido a que estos datos ya son libremente accesibles al público a través de cualquier navegador web estándar, enrutar la recolección a través de nodos terminales individuales evita legalmente los muros de pago comerciales. Una vez que estos pequeños paquetes de datos se recuperan, la red transfiere los datos sin refinar de vuelta a un servidor centralizado donde modelos de inteligencia artificial especializados limpian y auditan la información para el control de calidad.

"Al hacer esto, podemos reducir significativamente el costo que actualmente cobran muchas de las grandes empresas centralizadas como Google."

Impulsado por un bucle económico que incentiva a los participantes de la red de calidad

La siguiente pregunta es por qué alguien ofrecería voluntariamente su hardware a una red como esta, y la respuesta es sencilla: un bucle de valor compartido que garantiza que estos nodos ganen puntos por su conectividad pasiva que están programados para convertirse en tokens criptográficos nativos más adelante.

Según Anthony, este modelo distribuido "les permitirá ganar puntos" que actúan como una métrica directa de su contribución a la red, y por lo tanto "cada vez que la empresa genere ingresos, los tokens se devolverán al ecosistema" para mantener un bucle económico cíclico.

"También habrá tokens reservados que se utilizarán para la recompra de tokens", agregó.

Sin embargo, no todos los que ejecutan un nodo califican esencialmente para recompensas consistentes, ya que existe el desafío siempre presente del control de calidad, que puede comprometer la integridad del conjunto de datos si no se controla.

Perceptron aborda esto enrutando los paquetes recopilados de vuelta a un servidor centralizado, donde algoritmos automatizados evalúan sistemáticamente las entradas en comparación con los puntos de referencia objetivo antes de liberar cualquier compensación.

Además, Anthony dijo que la startup adquirió recientemente una empresa especializada en software de verificación de transacciones y pagos para automatizar estructuralmente este proceso de validación.

Para involucrar aún más a los participantes de la red y al mismo tiempo impulsar la creación de conjuntos de datos, Perceptron también planea lanzar una plataforma estructurada de Data Questing, que permitirá a los contribuyentes convertir el esfuerzo humano activo en entradas de entrenamiento únicas.

"Nuestro objetivo es poder construir conjuntos de datos y crear conjuntos de datos que actualmente no están disponibles a través de procesos centralizados", agregó Anthony.

El objetivo final

A largo plazo, Anthony dijo que le gustaría ver la red transicionar a un modelo centrado en inteligencia empresarial que pueda proporcionar análisis profundos para clientes empresariales.

"La diferencia es que los conjuntos de datos tradicionales son estáticos, se recopilan una vez y rápidamente se vuelven obsoletos. Pero hay una enorme cantidad de datos que se generan cada vez que interactúas con cualquier cosa en línea, y ahora mismo, la mayor parte simplemente se desperdicia", dijo Anthony.

"Un solo servidor que intenta monitorear todos estos diferentes usuarios realmente no puede recopilar inteligencia significativa a esa escala. Lo que necesitamos es un cambio hacia la inteligencia empresarial distribuida, para que podamos mejorar realmente servicios en áreas como el comercio electrónico, el trading y mucho más."

Perceptron también ha lanzado un Fondo de Datos de IA de $10 millones, a través del cual la plataplanea financiar a desarrolladores independientes y apoyar la implementación de "proyectos reales que brinden servicios reales". Bajo los términos del programa, los equipos de ingeniería seleccionados reciben cinco semanas de asistencia dedicada en infraestructura de datos y hasta 5 TB de datos del mundo real de forma gratuita para acelerar la optimización de modelos de IA en etapa inicial.

"El objetivo es apoyar a los proyectos a medida que crecen y sus requisitos de datos aumentan. Podemos convertirnos en uno de sus proveedores de referencia; es tanto una inversión en el ecosistema más amplio como una forma para nosotros de construir ingresos consistentes a largo plazo", señaló Anthony.

Al momento de la publicación, Anthony dijo que Perceptron ya está suministrando activamente diversos productos de datos a una variedad de empresas comerciales. La red proporciona extensos conjuntos de datos de imágenes a plataformas generativas de texto a video, incluida una empresa llamada Everlyn AI, para entrenar modelos a sintetizar con precisión contenido visual.

Más allá de eso, el proyecto también está superando la compilación de imágenes estándar, ya que la plataforma ha ingresado al sector del análisis de sentimientos al rastrear el discurso público en Twitter, YouTube y los mercados de activos digitales. Analizar este sentimiento público ayuda a las empresas y exchanges de criptomonedas a construir herramientas de seguimiento que brinden señales tempranas para anticipar cambios bruscos de precios.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado