Las llamadas de ontología para la verificación humana en datos de entrenamiento de IA sin sacrificar la privacidad

Ontology está llamando la atención sobre un problema creciente en el mundo de la IA: ¿cómo demostrar que una pieza de datos de entrenamiento proviene de una persona real sin convertir todo el proceso en una pesadilla para la privacidad?

En una publicación reciente, el proyecto argumentó que la respuesta no debería ser más vigilancia. En lugar de pedir a los contribuyentes que entreguen selfies, identificaciones, escaneos biométricos y otros datos personales, Ontology dice que la industria debería apoyarse en credenciales verificables y divulgación selectiva para que las personas puedan demostrar que son humanas sin revelar todo sobre sí mismas.

Esa idea importa más ahora que hace un año. La conversación sobre los datos de entrenamiento de IA claramente ha cambiado. Antes, se trataba principalmente de escala, volumen y cuánto dato se podía recopilar. Ahora, la pregunta más importante es de dónde provienen esos datos, si realmente son hechos por humanos y cuánto de ellos ya ha sido contaminado por contenido sintético.

Esa preocupación ya no es un tema de nicho. Se ha convertido en uno de los mayores dolores de cabeza para los equipos de IA que intentan construir modelos más limpios y confiables. Ontology dice que el mercado ya está empezando a tratar la prueba de identidad como un activo valioso. Los datos humanos verificados están empezando a convertirse en algo por lo que las empresas podrían tener que pagar extra.

La demanda está en aumento, pero la oferta es limitada, y la forma en que muchas plataformas planean verificar a las personas, en opinión de la compañía, está profundamente equivocada. El camino más fácil para la mayoría de las plataformas también es el más invasivo.

Si quieren saber si alguien es humano, generalmente piden más y más información personal. Pueden requerir un selfie, una identificación gubernamental, una verificación de vitalidad, seguimiento conductual, huellas digitales del dispositivo o una combinación de todo lo anterior.

Cada capa puede hacer que la verificación sea más confiable, pero también significa que el usuario cede más privacidad. Con el tiempo, la persona que intenta demostrar que es real se descompone en un conjunto de puntos de datos almacenados en los sistemas de otra persona. Ontology argumenta que esa es la decisión equivocada.

La compañía dice que el problema no es que las personas necesiten ser verificadas. El problema es que el modelo actual asume que la verificación tiene que venir con exposición permanente. Eso es lo que sucede cuando la industria usa herramientas centralizadas diseñadas para recopilar la mayor cantidad de datos posible. En la práctica, el humano se convierte en el costo de la confianza.

El Verdadero Avance

La alternativa a la que apunta Ontology está basada en el Modelo de Datos de Credenciales Verificables del W3C 2.0, que fue anunciado como Recomendación en mayo de 2025. La idea es bastante simple, incluso si la criptografía que la respalda no lo es: un emisor confiable, como un gobierno, un banco o un proveedor de verificación, puede confirmar algo sobre una persona una sola vez, y esa credencial puede residir en el propio dispositivo del usuario.

Cuando una plataforma necesita saber si esa persona es humana, el usuario puede presentar una prueba criptográfica en lugar de entregar todo el registro subyacente. Eso significa que el verificador obtiene lo que necesita y nada más.

Aprende que un emisor confiable ha confirmado que la persona es humana. No ve el archivo completo de identidad de la persona, datos biométricos u otros detalles adicionales. El emisor no necesita ser contactado cada vez que se usa la credencial, y el usuario no termina dejando un rastro de identificadores vinculables en diferentes plataformas.

Ontology dice que el verdadero avance aquí es la divulgación selectiva. Eso es lo que hace que el sistema sea verdaderamente respetuoso con la privacidad. Una credencial puede contener mucha información, pero el usuario solo revela las partes que importan para la solicitud específica. Entonces, si una plataforma solo necesita prueba de identidad, obtiene exactamente eso y nada más.

Sin datos personales adicionales, sin biometría, sin fragmentos de perfil reutilizables que puedan ser ensamblados después. La compañía también señaló su propio trabajo en identidad descentralizada, incluyendo ONT ID y la billetera ONTO, como ejemplos de este enfoque en práctica.

Según Ontology, estas herramientas están diseñadas para mantener las credenciales en el dispositivo y permitir a los usuarios generar pruebas localmente, sin exponer sus datos privados a emisores o verificadores. El punto más importante, sin embargo, no es solo sobre Ontology. Se trata de hacia dónde se dirige la infraestructura de IA.

A medida que las empresas corren para limpiar sus datos de entrenamiento y averiguar qué todavía se puede confiar, la presión para verificar a los contribuyentes humanos solo va a crecer. La verdadera pregunta es si la industria resuelve ese problema construyendo más vigilancia en la pila, o usando sistemas que permitan a las personas demostrar que son reales sin renunciar a su privacidad en el proceso.

Ontology claramente apuesta por la segunda opción. Y con las empresas de IA ahora preocupadas más por la procedencia que por la cantidad bruta, esa apuesta puede empezar a parecer menos un argumento de privacidad de nicho y más un requisito práctico para la próxima fase de recopilación de datos de IA.

ONT0,59%
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado