Perceptronは、アイドル帯域幅をAIトレーニングデータに変換している。

現在、人工知能分野は深刻なトレーニングデータのボトルネックに直面しています。特に、中央集権型テクノロジーの独占企業が、初期段階の開発者を高品質な情報パイプラインから締め出しているからです。分散型データインフラストラクチャプラットフォームのPerceptronは、日常のユーザーデバイスを通じてウェブ情報をクラウドソースする分散型インフラストラクチャ層を展開することで、この構造的なボトルネックに対処しようとしています。

まとめ

  • Perceptronは、アイドル状態の消費者帯域幅を活用して、公開されているウェブデータを収集し、低コストのAIトレーニングデータセットを提供しています。
  • 同プラットフォームによると、そのネットワークは150カ国以上に広がり、貢献者に報酬を提供しながら、エンタープライズクライアントに提供する前にデータ品質を検証しています。
  • Perceptronは、開発者がデータインフラにアクセスし、AIモデルの開発を加速するための1000万ドルのAIデータファンドを立ち上げました。

現代のメディアは、人工知能分野の主要企業が次世代ハードウェアシステムを絶えず導入して生の計算能力を強化していることを強調することに完全に焦点を当てています。しかし、最も議論されていない運用上の制約の1つは、機能的なAIモデルの核となる基盤を構成するトレーニングデータの品質です。

問題は、オープンウェブ上のコンテンツの大部分がすでに徹底的に収穫されているため、公開アプリケーションプログラミングインターフェースに対する攻撃的な企業統制により、データセット収集の残りの基盤が法外な数百万ドルのペイウォールの背後に閉じ込められていることです。実質的に、ごく一部の巨大テクノロジー独占企業にとっては、法外に高額な排他的特権となっています。

現在AI競争をリードしているテクノロジー大手にとって、これらの高コストの情報パイプラインを確保することは大きな財務上の課題ではありませんが、資金不足のイノベーターはどうでしょうか?必要な予算がないため、初期段階のスタートアップは競争力のある製品を構築するのに苦労しています。

「OpenAIは、RedditやTwitterなどの企業に、APIを通じてデータにアクセスするために、年間約6000万ドルから1億ドルを支払っています」と、Perceptronの共同設立者兼CEOであるPeter Anthony氏は、最近のインタビューでcrypto.newsに語りました。

「現在、多くの新しいAIプロジェクトには、データにアクセスするために6000万ドルから1億ドルを費やす予算がありません。たとえ世界最高のモデルを構築しても、良質なデータにアクセスできなければ、ほとんど役に立ちません。学校で最も賢い子供でも、本にアクセスできなければ、提示できる情報はほとんどありません。」

Anthony氏は、この市場の非対称性が、独立した市場セグメントにサービスを提供する代替インフラの余地を残していることに気づき、それが最終的に彼をPerceptronの共同設立へと導きました。Perceptronは、アイドル状態の消費者帯域幅を利用して、AIが現在苦しんでいる「データボトルネック問題」を解決することを計画しているプラットフォームです。

「世界のデータの大部分はすでにアクセスされスクレイピングされていますが、まだアクセスできないさまざまな場所に隠れているデータもたくさんあります。そのため、私たちはデータを収集し、AI企業に低コストでデータを提供できるように態勢を整えています」とAnthony氏は説明しました。

アイドル帯域幅の収穫

しかし、Perceptronが活用しようとしているこのアイドル帯域幅とは何でしょうか?Anthony氏は、これは日常のユーザーが日常的なデジタルブラウジングを通じて常に生成しているが、大手企業がそれを抽出して利益を得ているのをただ見ているだけの、認識されていない経済的資産であると説明しました。

「今、あなたと私がスマートフォンやコンピュータでインターネットを使用するたびに、データを生成しています。そのデータは、Googleのような企業によって収集され、大規模なデータセットにパッケージ化され、数百万、時には数十億ドルで販売されます。しかし、あなたと私はその価値の1セントも受け取っていません。」

Perceptronがしたことは、この収奪的なモデルを完全に逆転させることです。同社は150カ国以上に広がる約80万ノードからなるネットワークを構築しており、これらのノードは、Chromeのブラウザ拡張機能やAndroidデバイスのアプリケーションを実行しているだけの個々のユーザーによって駆動されています。

これらのエンドポイントインストールは、プライベートなデジタルファイルをスクレイピングしたり、企業に機密の個人テレメトリーを提供したりするわけではありません。その代わりに、ローカライズされた地理的視点を確保します。Anthony氏はこれを、オープンウェブ上の「異なる視点」と表現し、小さな断片に抽出され、1つの意味のあるデータセットに結合されると述べています。

「個人のデータを使用しているわけではなく、あなた自身の個人データや情報にアクセスしているわけではないという事実に焦点を当てることが非常に重要です。しかし、あなたがマラウイにいるとしましょう。特定のウェブサイトを見ているとき、私も同じウェブサイトを見ることができますが、おそらく私がドバイにいるため、異なる種類の結果セットが表示されるでしょう。この状況から得られるのは、あなたのコンピュータを使用して、通常のウェブページなどを表示できるようにすることだけです。」

例として、Anthony氏は、企業クライアントが米国からのヘルスケア関連のソーシャルメディア投稿のデータセットを必要とする場合、Perceptronはグローバルノードメッシュ全体で調整して、制限の厳しいエンタープライズAPIとやり取りすることなく、個々の公開投稿を抽出できると述べました。

このデータは標準的なウェブブラウザを介して一般に自由にアクセスできるため、個々のターミナルノードを介した収集のルーティングは、商業的なペイウォールを法的に回避します。これらの小さなデータパケットが取得されると、ネットワークは未加工のデータを中央サーバーに転送し、そこで特殊な人工知能モデルが品質管理のために情報をスクラブし監査します。

「これにより、Googleのような多くの大規模中央集権企業が現在請求しているコストを大幅に削減できます。」

質の高いネットワーク参加者を促進する経済的ループによって強化

次の質問は、なぜ誰もが自分のハードウェアをこのようなネットワークに自発的に提供するのかということですが、その答えは簡単です。共有価値ループにより、これらのノードは受動的な接続に対してポイントを獲得し、そのポイントは将来的にネイティブの暗号トークンに変換される予定です。

Anthony氏によると、この分散型モデルは「ポイントを獲得できるようにする」もので、これはネットワークへの貢献の直接的な指標として機能します。したがって、「企業によって収益が生み出されるたびに、トークンはエコシステムに還元され」、循環的な経済ループを維持します。

「トークンを買い戻すために使用されるトークンも別途確保されます」と彼は付け加えました。

しかし、ノードを実行するすべての人が一貫した報酬を得られるわけではありません。なぜなら、品質管理という常に存在する課題があり、それが放置されるとデータセットの整合性を損なう可能性があるからです。

Perceptronは、収集したパケットを中央サーバーにルーティングすることでこれに対処しています。中央サーバーでは、自動化されたアルゴリズムが、補償をリリースする前に、目標ベンチマークに対して入力を体系的に評価します。

さらに、Anthony氏は、このスタートアップが最近、取引および支払い検証ソフトウェアを専門とする企業を買収し、この検証プロセスを構造的に自動化したと述べました。

ネットワーク参加者のさらなる関与を促し、データセットの作成を促進するために、Perceptronはまた、構造化されたData Questingプラットフォームを立ち上げる計画です。これにより、貢献者は積極的な人間の努力を独自のトレーニング入力に変換できるようになります。

「私たちは、中央集権的なプロセスでは現在利用できないデータセットを効果的に構築および作成できるようにすることを目指しています」とAnthony氏は付け加えました。

最終目標

長期的には、Anthony氏は、ネットワークがエンタープライズクライアントに深層分析を提供できるビジネスインテリジェンス重視のモデルに移行するのを見たいと述べました。

「違いは、従来のデータセットは静的に収集され、すぐに時代遅れになることです。しかし、オンラインで何かとやり取りするたびに膨大な量のデータが生成されており、現在、その大部分は単に無駄になっています」とAnthony氏は述べました。

「1台のサーバーでこれらすべての異なるユーザーを監視しようとしても、その規模で意味のあるインテリジェンスを収集することはできません。必要なのは、分散型ビジネスインテリジェンスへのシフトです。そうすれば、eコマース、取引など、さまざまなサービスを実際に改善できます。」

Perceptronはまた、1000万ドルのAIデータファンドを立ち上げており、このファンドを通じて独立した開発者に資金を提供し、「実際のサービスを提供している実際のプロジェクト」の展開を支援する予定です。プログラムの条件の下で、選ばれたエンジニアリングチームは、5週間の専用データインフラ支援と、最大5 TBの実際のデータを無料で受け取り、初期段階のAIモデルの最適化を加速します。

「目標は、プロジェクトが成長し、データ要件が増加するにつれてそれらをサポートすることです。私たちは彼らの頼りになるプロバイダーの1つになることができます。これは、より広範なエコシステムへの投資であると同時に、一貫した長期的な収益を構築する方法でもあります」とAnthony氏は述べました。

記事の執筆時点で、Anthony氏はPerceptronがすでに多様なデータ製品をさまざまな商業企業に積極的に提供していると述べました。このネットワークは、Everlyn AIと呼ばれる企業を含むテキストからビデオへの生成プラットフォームに、視覚コンテンツを正確に合成するモデルをトレーニングするための広範な画像データセットを提供しています。

さらに、このプロジェクトは標準的な画像コンパイルを超えて、Twitter、YouTube、デジタル資産市場にわたる公開討論を追跡することで、感情分析セクターにも参入しています。この公開感情を分析することで、暗号企業や取引所は、突然の価格変動を先取りするための早期シグナルを提供する追跡ツールを構築できます。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め