Онтология требует человеческой проверки в данных для обучения ИИ без ущерба для конфиденциальности

Онтология обращает внимание на растущую проблему в мире ИИ: как доказать, что часть обучающих данных поступила от реального человека, не превращая весь процесс в кошмар для конфиденциальности?

В недавнем посте проект утверждал, что ответ не должен заключаться в усилении слежки. Вместо того чтобы требовать у участников сдавать селфи, удостоверения личности, биометрические сканы и другие личные данные, Онтология говорит, что индустрия должна опираться на проверяемые удостоверения и выборочные раскрытия, чтобы люди могли доказать, что они человек, не раскрывая всю информацию о себе.

Эта идея важнее сейчас, чем год назад. Разговор о данных для обучения ИИ явно сместился. Раньше речь шла в основном о масштабе, объеме и том, сколько данных можно собрать. Теперь более важный вопрос — откуда эти данные, являются ли они действительно человеческими, и насколько много из них уже загрязнено синтетическим контентом.

Эта проблема больше не является нишевой. Она стала одной из главных головных болей команд, создающих более чистые и надежные модели ИИ. Онтология утверждает, что рынок уже начинает рассматривать доказательство личности как ценное активы. Проверенные человеческие данные становятся чем-то, за что компании, возможно, придется платить дополнительно.

Спрос растет, а предложение ограничено, и способ, которым многие платформы планируют проверять людей, по мнению компании, глубоко ошибочен. Самый простой путь для большинства платформ — это также самый навязчивый.

Если им нужно знать, человек ли это, они обычно требуют все больше и больше личной информации. Может потребоваться селфи, государственное удостоверение, проверка живости, отслеживание поведения, отпечатки устройства или их комбинация.

Каждый слой может повысить уверенность в проверке, но также означает, что пользователь теряет больше конфиденциальности. Со временем человек, пытающийся доказать, что он реален, превращается в набор данных, хранящихся в системах другого. Онтология утверждает, что это неправильный компромисс.

Компания говорит, что проблема не в необходимости верификации людей. Проблема в том, что текущая модель предполагает, что проверка должна сопровождаться постоянным раскрытием данных. Именно так происходит, когда индустрия использует централизованные инструменты, предназначенные для сбора как можно большего объема данных. На практике человек становится затратой доверия.

Настоящий прорыв

Альтернатива, на которую указывает Онтология, основана на модели данных W3C Verifiable Credentials 2.0, которая была объявлена рекомендацией в мае 2025 года. Идея довольно проста, даже если криптография, лежащая в основе, — нет: доверенный эмитент, такой как правительство, банк или поставщик проверки, может подтвердить что-то о человеке один раз, и этот сертификат может храниться на устройстве пользователя.

Когда платформа позже должна определить, является ли человек реальным, пользователь может предъявить криптографическое доказательство вместо передачи всей исходной записи. Это означает, что проверяющий получает то, что ему нужно, и ничего лишнего.

Он узнает, что доверенный эмитент подтвердил, что человек — реальный. Он не видит полного файла личности, биометрических данных или других дополнительных деталей. Эмитент не нуждается в контакте каждый раз при использовании сертификата, а пользователь не оставляет след связных идентификаторов на разных платформах.

Онтология говорит, что настоящий прорыв — это выборочное раскрытие. Именно оно делает систему по-настоящему защищенной с точки зрения конфиденциальности. Удостоверение может содержать много информации, но пользователь раскрывает только те части, которые важны для конкретного запроса. Так, если платформа нуждается только в доказательстве личности, она получает именно это и ничего больше.

Никаких дополнительных личных данных, биометрии или повторно используемых фрагментов профиля, которые можно было бы соединить позже. Компания также указала на свою работу в области децентрализованной идентичности, включая ONT ID и кошелек ONTO, как примеры этого подхода на практике.

По словам Онтологии, эти инструменты предназначены для хранения удостоверений на устройстве и позволяют пользователям генерировать доказательства локально, не раскрывая свои личные данные эмитентам или проверяющим. Более важный аспект, однако, не только в Онтологии. Он в том, куда движется инфраструктура ИИ.

По мере того как компании борются за очистку своих обучающих данных и выясняют, чему еще можно доверять, давление на проверку человеческих участников только возрастает. Настоящий вопрос — решит ли индустрия эту проблему, внедряя больше слежки в стек, или создаст системы, позволяющие людям доказывать свою реальность, не жертвуя конфиденциальностью.

Онтология явно делает ставку на второй вариант. И с учетом того, что компании ИИ теперь больше заботятся о происхождении данных, чем о их объеме, эта ставка может начать выглядеть менее как нишевой аргумент в пользу конфиденциальности и больше как практическое требование для следующей фазы сбора данных для ИИ.

ONT4,49%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено