Os dados de IA mais valiosos do mundo estão protegidos.


Não pela tecnologia. Pela confiança.

Vamos mudar a perspectiva sobre o que eu acho que o OpenLedger representa fundamentalmente.
A justiça é o tema comum da história. Pague os contribuidores de dados. Democratize a IA. Pague os indivíduos que criaram os modelos.

Isso é real. E importa.
No entanto, acredito que não aborda a questão economicamente mais relevante que o OpenLedger enfrentará.

Não compensação de dados. Desbloqueio de dados.
Este é o problema de dados que ninguém está dizendo claramente o suficiente.

A maior parte das melhores informações de treinamento do mundo não está na Internet.

Está dentro de sistemas hospitalares que não conseguem comunicar informações de pacientes sem violar regulamentos HIPAA.
Está em bancos de dados de pesquisa farmacêutica, inacessíveis por causa de acordos de confidencialidade.
Está em bancos com anos e anos de dados proprietários de negociação.
Está em escritórios de advocacia onde casos mudariam a natureza do raciocínio jurídico de IA.
O que há em fábricas onde dados de sensores poderiam transformar a manutenção preditiva.

Esses dados existem. São realmente valiosos.
Se uma empresa desenvolve um sistema de IA com eles, teria um poder muito maior do que um sistema de IA desenvolvido com dados da internet, que são públicos.

Mas é quase impossível que haja quantidade suficiente deles que possam realmente ser usados para treinamento de IA.

Não por problemas técnicos. Como resultado da falta de confiança.

Quanto às informações de pacientes, o hospital não consegue garantir que essas informações não serão compartilhadas e você não consegue garantir o que acontece com elas após serem compartilhadas.
Como a empresa farmacêutica não consegue demonstrar atribuição e controle ao usar dados downstream, ela não pode compartilhar dados de pesquisa.
A instituição financeira pode não conseguir fornecer dados de negociação porque não consegue manter os logs de auditoria necessários para fins regulatórios.

Não são questões tecnológicas. São questões de origem e rastreabilidade.

Quem usou esses dados? Para que propósito? Podemos provar isso? Podemos auditar? É possível impor restrições ao seu compartilhamento?

Se as respostas a essas perguntas não forem dadas, os dados permanecem trancados.
Qualquer valor que você possa oferecer aos doadores.

É neste ponto que a infraestrutura do OpenLedger fica interessante, além da história de "pagar contribuintes de forma justa".

Prova de Atribuição não é simplesmente uma rede de pagamento.
Ela apoia a Geração de Linhagem de Dados verificável.
Todos os conjuntos de dados adicionados a uma Datanet vêm acompanhados de um histórico criptográfico de sua origem, de como foram usados e de como afetam a saída do modelo.
Ela é na cadeia e não faz parte do banco de dados de nenhuma organização individual e pode ser auditada por qualquer pessoa com acesso adequado.

Para o hospital que pensa em compartilhar dados de pacientes desidentificados, essa é uma cadeia de custódia que é legalmente defensável para o hospital.
Podemos demonstrar o que ocorreu com esses dados.
Podemos provar que eles estão sendo usados apenas para o que divulgamos.
A trilha de auditoria pode ser fornecida se exigida por equipes de conformidade e reguladores.

Essa é uma evidência de atribuição que protege a pesquisa proprietária da farmacêutica.
Evidência de que nossos dados foram usados pode ser fornecida.
Temos a capacidade de impor os termos de licenciamento.
Podemos participar do valor que nossa contribuição traz para nossa pesquisa subjacente, sem colocá-los em risco.

Essa é a documentação regulatória que tornará possível a integração de IA para a instituição financeira.
É possível mostrar como a governança de dados pode ser demonstrada.
Somos capazes de atender às necessidades de auditoria.
Não precisamos sacrificar requisitos de confidencialidade no desenvolvimento de IA.

O mercado potencial representado por esse desbloqueio é muito maior do que o mercado de recompensar contribuintes individuais de dados.

A próxima fronteira de aprimoramento da capacidade de IA é o dado empresarial, os dados de alto valor, específicos de domínio, que existem em sistemas institucionais.
Estes serão dramaticamente mais poderosos do que os modelos que não podem acessá-los.

Nem é porque as organizações que detêm os dados não queiram fazer parte do desenvolvimento de IA.

Muitos deles desejam.
A razão pela qual não os disponibilizam é porque não conseguem atender aos padrões de confiança, proveniência e auditoria que se espera para compartilhar dados de forma responsável.

A infraestrutura do OpenLedger pode ser essa chave.
Não é para pessoas com poucos pontos a coletar para amostras de escrita.
Para instituições, não apenas desbloqueando bilhões em ativos de dados, mas também pelo valor de treinamento de IA.

Quero deixar claro que isso exige muito trabalho.
A implementação de infraestruturas de dados baseadas em blockchain em empresas não é rápida.
O processo de aquisição pode levar bastante tempo.
A revisão legal é muito rigorosa.
Integrar com a governança de dados existente é difícil.

O mercado de contribuintes individuais (onde pessoas enviam conjuntos de dados para Datanets por uma recompensa em tokens) pode aumentar significativamente de tamanho.
O mercado institucional opera em um ritmo completamente diferente.

Existe um problema de ovo e galinha.
As instituições seriam integradas quando a infraestrutura for comprovada em escala.
Só quando suficientes instituições se integrarem que a infraestrutura será colocada à prova.

Só há uma maneira de quebrar esse ciclo: ou alguém será o primeiro a comprar um destaque (ou o primeiro a vendê-lo), ou o custo de passar dados valiosos sem uma forma de compartilhá-los tornará mais caro do que investir em nova infraestrutura.

Ambas essas condições estão se desenvolvendo.
Até agora, elas não estão aqui.

Mas, no que eu sempre volto.

A Internet não abriu seu potencial para as pessoas compartilharem informações.
Ela realmente se consolidou quando outras instituições — bancos, varejistas, mídia, governos — começaram a desenvolver sobre ela.

A base é sua camada de contribuidores individuais, OpenLedger.
Fascinante, concreta, valiosa de construir.

A escala econômica reside no nível institucional.
Se o OpenLedger puder criar a rede de confiança necessária para possibilitar o compartilhamento de dados institucionais e se o ambiente regulatório continuar mudando de forma que isso se torne uma exigência de conformidade e não apenas uma vantagem, então $OPEN não está sendo precificado para esse mercado endereçável.

Nem perto disso.

Ou isso é um grande negócio, ou uma grande oportunidade.
Ou uma ideia que não se concretiza rápido o suficiente para que muitos detentores de $OPEN possam esperar.

Realmente não tenho certeza de qual das duas.

Mas os sinais de adoção institucional são mais monitorados do que os sinais de contribuintes individuais.

E é aí que reside o verdadeiro mercado, afinal.
Você está convencido de que o desbloqueio de dados empresariais é a grande oportunidade do OpenLedger, maior do que a compensação de contribuintes individuais?

@OpenLedger $OPEN #OpenLedger
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado