Perceptron превращает неиспользуемую пропускную способность в данные для обучения ИИ.

Сфера искусственного интеллекта в настоящее время сталкивается с серьезным узким местом в области обучающих данных, особенно из-за того, что централизованные технологические монополии блокируют доступ разработчиков начального уровня к высококачественным информационным каналам. Децентрализованная платформа для работы с данными Perceptron пытается решить эту структурную проблему, развертывая децентрализованный инфраструктурный уровень, который собирает информацию из интернета с помощью повседневных устройств пользователей.

Краткое описание

  • Perceptron использует неиспользуемую пропускную способность потребителей для сбора общедоступных веб-данных и предоставления более дешевых наборов данных для обучения ИИ.
  • Платформа утверждает, что ее сеть охватывает более 150 стран и вознаграждает участников, проверяя качество данных перед их передачей корпоративным клиентам.
  • Perceptron запустил фонд AI Data Fund в размере $10 млн, чтобы помочь разработчикам получить доступ к инфраструктуре данных и ускорить разработку моделей ИИ.

Современные СМИ полностью сосредоточены на том, как ведущие имена в сфере искусственного интеллекта постоянно развертывают системы следующего поколения для наращивания своей вычислительной мощности. Но одним из наименее обсуждаемых операционных ограничений является качество обучающих данных, составляющих основу любой функциональной модели ИИ.

Проблема в том, что, поскольку подавляющая часть открытого веб-контента уже тщательно собрана, агрессивный корпоративный контроль за общедоступными интерфейсами прикладного программирования заблокировал остальные основы сбора наборов данных за непомерными многомиллионными платежными барьерами. По сути, это стало непомерно дорогой исключительной привилегией для горстки крупных технологических монополий.

Для технологических гигантов, которые в настоящее время лидируют в гонке ИИ, обеспечение этих дорогостоящих информационных каналов не является большой финансовой проблемой, но как насчет недостаточно финансируемых новаторов? Не имея необходимых бюджетов, стартапы на ранних стадиях остаются в борьбе за создание конкурентоспособных продуктов.

«OpenAI платит примерно от 60 до 100 миллионов долларов в год таким компаниям, как Reddit и Twitter, чтобы иметь возможность доступа к данным через API», — рассказал crypto.news в недавнем интервью сооснователь и генеральный директор Perceptron Питер Энтони.

«У многих новых проектов в области ИИ нет бюджетов, чтобы тратить от 60 до 100 миллионов долларов на доступ к данным. Если вы создаете лучшую модель в мире, она бесполезна, если у нее нет доступа к качественным данным. Вы можете быть самым умным ребенком в школе, но если у вас нет доступа к книгам, у вас на самом деле не так много информации для представления».

Энтони понял, что эта асимметрия рынка оставляет место для альтернативной инфраструктуры, которая будет обслуживать независимый сегмент рынка, что в итоге привело его к созданию Perceptron — платформы, которая планирует использовать неиспользуемую пропускную способность потребителей для решения «проблемы узкого места данных», от которой сейчас страдает ИИ.

«Большая часть мировых данных уже была получена и собрана, но есть много данных, которые как бы скрыты в разных местах, к которым пока нет доступа. Поэтому мы собираем данные и позиционируем себя так, чтобы иметь возможность предоставлять данные для компаний, занимающихся ИИ, по сниженной цене», — объяснил Энтони.

Использование неиспользуемой пропускной способности

Но что это за неиспользуемая пропускная способность, которую Perceptron планирует использовать? Энтони объяснил, что это непризнанный экономический актив, который обычные пользователи постоянно производят в процессе обычного цифрового серфинга, только чтобы наблюдать, как крупные корпорации извлекают из него прибыль.

«Прямо сейчас каждый раз, когда вы и я пользуемся интернетом на наших телефонах и компьютерах, мы генерируем данные. Эти данные собираются, упаковываются в огромные наборы данных такими компаниями, как Google, и продаются за миллионы, иногда миллиарды долларов. Но вы и я не видим ни цента от этой стоимости».

Perceptron полностью перевернул эту добывающую модель. Они построили сеть, охватывающую более 150 стран и насчитывающую примерно 800 000 узлов, и эти узлы работают на отдельных пользователях, которые просто запускают расширение браузера в Chrome или приложение на своих устройствах Android.

Хотя эти конечные установки не собирают частные цифровые файлы и не предоставляют фирме конфиденциальные личные телеметрические данные, они вместо этого обеспечивают локализованные географические перспективы, которые Энтони описал как «разные точки обзора» на открытый веб, которые затем можно извлекать небольшими фрагментами и объединять в один значимый набор данных.

«Очень важно сосредоточиться на том, что это не использование личных данных, не вторжение в ваши личные данные и информацию. Но допустим, вы сейчас в Малави. Когда вы смотрите на определенный веб-сайт, я мог бы зайти и посмотреть тот же сайт, но, скорее всего, поскольку я в Дубае, мы увидим разные наборы результатов. Все, что мы получаем из этой ситуации, — это возможность использовать ваш компьютер для просмотра чего-то вроде обычной веб-страницы или чего-то еще».

В качестве иллюстрации Энтони отметил, что если корпоративному клиенту требуется набор данных о сообщениях в социальных сетях, связанных со здравоохранением, из США, Perceptron может координировать работу по всей своей глобальной сети узлов, чтобы извлекать отдельные общедоступные сообщения без взаимодействия с ограничительными корпоративными API.

Поскольку эти данные уже свободно доступны публике через любой стандартный веб-браузер, маршрутизация сбора через отдельные терминальные узлы законно обходит коммерческие платежные барьеры. После извлечения этих небольших пакетов данных сеть передает необработанные данные обратно на центральный сервер, где специализированные модели искусственного интеллекта очищают и проверяют информацию для контроля качества.

«Таким образом, мы можем значительно снизить стоимость, которую в настоящее время взимают многие крупные централизованные компании, такие как Google».

Движущая сила — экономический цикл, стимулирующий качественных участников сети

Следующий вопрос: почему кто-то добровольно предоставляет свое оборудование такой сети? Ответ прост: это цикл общей ценности, гарантирующий, что эти узлы получают баллы за свою пассивную связь, которые в будущем планируется конвертировать в нативные криптотокены.

По словам Энтони, эта распределенная модель «позволит им зарабатывать баллы», которые служат прямым показателем их вклада в сеть, и поэтому «всякий раз, когда компания генерирует доход, токены будут возвращаться в экосистему» для поддержания циклического экономического цикла.

«Также будут выделены токены, которые будут использоваться для обратного выкупа токенов», — добавил он.

Однако не каждый, кто запускает узел, по сути, получает постоянные вознаграждения, поскольку существует постоянная проблема контроля качества, которая может поставить под угрозу целостность набора данных, если ее не контролировать.

Perceptron решает эту проблему, направляя собранные пакеты обратно на центральный сервер, где автоматизированные алгоритмы систематически оценивают входные данные на соответствие целевым эталонам, прежде чем выпустить какую-либо компенсацию.

Кроме того, Энтони сказал, что стартап недавно приобрел компанию, специализирующуюся на программном обеспечении для проверки транзакций и платежей, чтобы структурно автоматизировать этот процесс проверки.

Чтобы еще больше привлечь участников сети, а также стимулировать создание наборов данных, Perceptron также планирует запустить структурированную платформу Data Questing, которая позволит участникам превращать активные человеческие усилия в уникальные обучающие вводные данные.

«Мы стремимся эффективно создавать наборы данных и создавать наборы данных, которые в настоящее время недоступны с помощью централизованных процессов», — добавил Энтони.

Конечная цель

В долгосрочной перспективе Энтони сказал, что хотел бы увидеть переход сети к модели, ориентированной на бизнес-аналитику, способной предоставлять глубокую аналитику для корпоративных клиентов.

«Разница в том, что традиционные наборы данных статичны: их собирают один раз, и они быстро устаревают. Но огромное количество данных генерируется каждый раз, когда вы взаимодействуете с чем-либо в интернете, и сейчас большая их часть просто пропадает», — сказал Энтони.

«Один сервер, пытающийся отслеживать всех этих разных пользователей, не может собирать значимую аналитику в таком масштабе. Нам нужен переход к распределенной бизнес-аналитике, чтобы мы могли улучшать услуги в таких областях, как электронная коммерция, трейдинг и многое другое».

Perceptron также запустил фонд AI Data Fund в размере $10 млн, через который платформа планирует финансировать независимых разработчиков и поддерживать развертывание «реальных проектов, предоставляющих реальные услуги». В рамках программы отобранные инженерные команды получают пять недель специальной поддержки в области инфраструктуры данных и до 5 ТБ реальных данных бесплатно для ускорения оптимизации моделей ИИ на ранних стадиях.

«Цель — поддерживать проекты по мере их роста и увеличения потребностей в данных. Мы можем стать одним из их основных поставщиков; это одновременно инвестиции в более широкую экосистему и способ построить стабильный долгосрочный доход», — отметил Энтони.

На момент публикации Энтони сказал, что Perceptron уже активно поставляет разнообразные продукты данных различным коммерческим предприятиям. Сеть предоставляет обширные наборы изображений для генеративных платформ «текст-в-видео», включая компанию Everlyn AI, для обучения моделей точному синтезу визуального контента.

Кроме того, проект выходит за рамки стандартного сбора изображений, поскольку платформа вышла в сектор анализа настроений, отслеживая общественные обсуждения в Twitter, YouTube и на рынках цифровых активов. Анализ этих общественных настроений помогает криптофирмам и биржам создавать инструменты отслеживания, которые дают ранние сигналы для предотвращения внезапных колебаний цен.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено