a16zが3300万ドルのシードラウンドをリード — Yuppがブロックチェーンとインセンティブを活用してAI評価モデルを再定義する方法

中級6/19/2025, 2:54:41 AM
a16zは3300万ドルのシードラウンドを主導しました。Yuppはどのようにブロックチェーンとインセンティブメカニズムを通じてAIモデル評価を再形成するのでしょうか?この記事では、そのクラウドソース評価モデル、VIBEスコアリングシステム、技術アーキテクチャ、開発ビジョンを詳述し、AIとWeb3の交差点での新しい可能性を探ります。

AIアプリケーションがさまざまな業界に浸透する中、モデルのパフォーマンスを正確に評価し、ユーザーの信頼を高めることが緊急の課題となっています。従来の評価は中央集権的なメカニズムに依存することが多く、多様なシナリオをカバーすることが困難で、真のユーザーの好みを反映することができません。同時に、モデルの「ハルシネーション」の問題が頻繁に発生し、ユーザーが選択を行う際に情報のサイロに陥ることがよくあります。

この文脈において、Yuppは新しいプラットフォームとして、独自のクラウドソーシングモデルとインセンティブメカニズムを用いてAIモデルの発見、比較、利用を再構築し、AI評価の分野にパラダイムシフトをもたらそうとしています。この記事では、Yuppのコアメカニズム、技術的ハイライト、チームの背景、そしてAIエコシステムに与える潜在的な影響について掘り下げます。

チームの背景と資金調達:テックジャイアンツからの経験に支えられて

Yuppは、AI分野における長年の評価課題を解決することに注力しており、「トラストレス」なAIフィードバック市場を構築することに専念しています。これにより、多様なユーザーフィードバックがブロックチェーンと暗号経済的インセンティブの保護の下で自由に流通し、スケーラブルで公平かつ透明なモデル評価レイヤーが形成されます。高品質の手動アノテーションデータの配布にインセンティブを与えることによって、Yuppはさまざまなシナリオにおけるユーザーの真のニーズと好みを迅速に把握し、AI開発者がモデルのパフォーマンスを反復的に最適化するのを助けます。

このプロジェクトは、2024年6月にPankaj Gupta(共同創設者兼CEO)とGilad Mishne(共同創設者兼AI責任者)によって設立され、Chief ScientistのJimmy Lin(ウォータールー大学の教授)もコアチームに参加しました。三人は以前、2010年にTwitterで一緒に働き、大規模な推薦システムと検索システムを構築・最適化し、その後GoogleやCoinbaseで広範な経験を積みました。

データ価値の分散化と透明性のビジョンにより、信頼できる評価とユーザー参加へのAI製造業者の二重の要求を満たすことができ、さらにコアチームの豊富な経験から利益を得て、Yuppはテクノロジー業界の著名人やトップベンチャーキャピタリストから高い評価を得ています。

先週、YuppはA16zのパートナーであるクリス・ディクソンが主導する3300万ドルのシードラウンドファイナンスの完了を発表しました。他の投資家には、Googleのチーフサイエンティストであるジェフ・ディーン、Twitterの共同創設者であるビズ・ストーン、Pinterestの共同創設者であるエヴァン・シャープ、PerplexityのCEOアラヴィンド・スリニヴァス、スタンフォード大学のダン・ボーネ、クリス・レ、ニック・マキューン、バラジ・プラバカールなど、45人の著名なエンジェルや企業幹部、さらにCoinbase Venturesが含まれています。

コア機能とユーザー体験:"AI議会"の構築

中央集権的なAI評価プラットフォームであるYuppは、「すべての人のためのすべてのAI」という哲学を遵守し、ユーザーが最新のAIモデルを簡単に発見、比較、利用できるようにしています。従来の単一応答とは異なり、Yuppは各プロンプトに対して2つ(あるいはそれ以上)のモデルから同時に回答を返し、「AI議会」を形成します。このデザインは、ユーザーの多様な選択に対する要求を満たすだけでなく、モデルが生成する可能性のある「幻覚」を効果的に特定し、比較を通じてユーザーがより情報に基づいた意思決定を行えるようにします。YuppのCEOであるPankaj Guptaが述べたように、並列出力は生成エラーを懸念するユーザーにとって特に有益であり、結果を相互確認することができます。

このプラットフォームは現在、500以上のAIモデルをサポートしており、テキストおよび画像生成の分野をカバーしています。ChatGPT、Claude、Gemini、DeepSeek、Grok、Llamaなどの有名なモデルや、多くの新興モデルが含まれています。体験をさらに最適化するために、Yuppは「QuickTake」機能も導入しました。この機能は、長い返信を簡潔なツイートに要約することができます。

さらに、Yuppはユーザーのプライバシーを非常に重視しています:すべてのチャット記録はデフォルトでプライベートであり、ユーザーが積極的に公開しない限り、個人情報は開示されません。ユーザーは、いつでも共有の内容と範囲を制御できます。

経済モデルとインセンティブメカニズム:データ労働の評価

Yuppは、ユーザーのフィードバックを無料で利用し、「Yuppポイント」システムを通じてモデルの使用状況を測定します。新しいユーザーは登録時に5000ポイントを受け取り、モデルの応答を評価したり、好みを選択したり、理由を説明したりすることでさらにポイントを獲得できます。フィードバックの質が高いほど報酬が大きくなり、ユーザーはClaude Opus 4やOpenAI o3のような高級モデルを無料で持続的に使用できるようになります。このプラットフォームは、ポイントが増え続けることを約束しており、すべての現在のモデルを無料で体験できるとしています。

各質問の後、ユーザーは2つのモデル応答を受け取り、フィードバックを通じて「デジタルスクラッチカード」を獲得することができ、0から250の範囲でYuppポイントが報酬として与えられます。1000ポイントごとに1ドルと交換でき、1日の最大引き出し額は10ドル、月の最大引き出し額は50ドルです。ポイントはドルやユーロを含む20以上の通貨と交換可能で、Stripe、PayPal、Coinbaseなどのパートナーと提携しています。同時に、プラットフォームはBase Ethernet L2とSolanaステーブルコインを統合し、グローバルなユーザーに即時の手数料無料の報酬を提供します。

Pankaj Guptaが言ったように、ユーザーによって生成される高品質なフィードバックは、AI企業のモデルファインチューニングや強化学習にとって、報酬そのものよりもはるかに価値があります。ユーザーの月収はせいぜい数杯のコーヒーに相当するかもしれませんが、この有料アノテーションデータはAIのイテレーションにとって重要です。

より多くの人々に参加を促すため、Yuppは紹介報酬も設けました:紹介者は5000ポイントを受け取り、紹介された人は1000ポイントを受け取ります;現在、新しく登録したユーザーは5000ポイントを受け取ることができ、紹介された人はさらに2500ポイントを受け取ります。

Yupp VIBE評価:AI評価の新しいパラダイム

ランキングの透明性不足、公平性の欠如、評価データへのアクセスの不均衡といった既存の問題に対処するため、YuppはAIランキングのベータ版と「Yupp VIBE (Vibe Intelligence Benchmark) Score」評価システムを発表しました。このシステムは、自然なインタラクションで生成されたグローバルユーザーの好みデータを集約し、堅牢で信頼性のある評価結果を提供することを目的としています。

Yuppの評価原則には次のものが含まれます:

  • 堅牢性:代表性を確保する(多様なシナリオをカバー)、真実性を反映する(ユーザーの懸念を反映)、および不正対策(悪意のある行動に抵抗する);
  • 信頼性: 公平かつ中立(モデルに対して偏りがない)、透明で公開(ランキングアルゴリズムの詳細な開示)、厳格かつ科学的(評価基準に従う)。

プラットフォームは、バイナリープリファレンスを収集するだけでなく、ユーザーが返信の利点と欠点(「要点を押さえた」、「速いスピード」、「良いスタイル」など)を指摘することを奨励し、ユーザーの年齢、教育、職業、その他の情報に基づいてクラスタ分析を行い、異なるグループ間の嗜好の違いを示します。

技術的なレベルで、Yuppはブロックチェーン、暗号学的プリミティブ、およびゼロ知識証明の使用を探求しており、評価プロセスが公正で透明かつ検証可能であることを確保しています。同時に、プラットフォームはプロフェッショナルなAIデータプロバイダーと提携し、アーカイブ検証とマルチレイヤー品質検出を通じてスコアラーを調整し、悪意のあるデータを排除しています。

最近のリーダーボードが更新され、GPT‑4.5プレビュー、Claude Opus 4、Claude Sonnet 4などのモデルのVIBEスコアが表示されており、勝率、嫌われ率、速度、レイテンシ、コンテキストウィンドウ、コストメトリクスも含まれています。

開発の歴史と将来の展望

Yuppは2025年6月13日に正式にローンチされ、6ヶ月間の内部テストを経てリリースされました。ローンチ以来、製品は継続的にイテレーションを重ねています。

  • マルチモーダルサポート:Dall‑E、Flux、Stable Diffusion、Luma Photon、Google Imagen 4などのモデルにアクセスし、ユーザーが画像/PDFをアップロードして質問できるようにサポートします。
  • インタラクション方法の拡張: 音声入力と音声読み上げ機能を追加しました;
  • モデルアップデート:DeepSeek R1/V3、Mistral Small 3、OpenAI o3-pro、Hermes 3、Amazon Nova Pro v1、Microsoft Phiシリーズ、及び「MAXモデル」カテゴリを段階的に導入中;
  • リアルタイム情報:オンラインクエリリクエストをPerplexityとGoogle Gemini Liveにルーティングし、ハイパーリンクされた引用を含める;
  • 支払いアップグレード:US PayPal、Venmo 引き出しと、PayPal を介した 24 通貨のサポートを追加しました;
  • 共有エクスポート: 形式を保持したコピー、PDF/Text/Markdownエクスポートをサポートし、必要に応じて単一の返信または全体の会話を共有します;
  • コミュニティ活動:『AIプロンプトチャレンジ』のようなイベントを開催し、数万ポイントの賞品を用意しています;個人プロフィールページやAI生成のチャット名などの新機能。

Yuppのミッションは「人類がAIの未来を形作る力を与える」ことです。Pankaj Guptaは、AIの発展には誰もが参加し、貢献することが必要だと考えています。多様な視点からのAIの応答とユーザーのフィードバックを通じて、Yuppはユーザーがより良い意思決定を行う手助けをするだけでなく、AIの進化のための継続的な推進力も提供します。

Yuppの主な競合の一つは、オープンAIモデル評価プラットフォームLMArenaであることは言及する価値があります(ウェブサイト:https://lmarena.ai/)このウェブサイトはAI専門家の間で非常に人気がありますが、プラットフォームは現在商業探索の段階にあり、ブロックチェーン技術を活用してユーザー参加のための直接的な物質的報酬やポイントインセンティブメカニズムを提供していません。

全体として、Yuppはクラウドソーシングモデル、インセンティブメカニズム、実際のユーザーの好みに基づいた評価システムにより、AI評価の新しい道を切り開きました。これは、ユーザーに無料で多様なAIインタラクティブ体験を提供するだけでなく、ユーザーのフィードバックを高価値なトレーニングデータに変換し、モデルの継続的な最適化を促進します。経験豊富なチームと一流の資本の支援を受けて、Yuppは将来のAIエコシステムにおいて重要な役割を果たすと期待されており、「すべての人のためのAI、すべての人によって形作られる」というビジョンを実現します。

しかし、最近立ち上げられたYuppにとって、大量のユーザーが参加する中でデータ品質を継続的に確保し、潜在的な不正行為に抵抗し、商業化とユーザーインセンティブのバランスを取る方法は、今後の発展において探求し最適化する必要がある方向性である。

声明:

  1. この記事は[から転載されています。PANews] 著作権は原作者に帰属します [深セン] 再印刷に対する異議がある場合は、連絡してください ゲートラーニングチームチームは関連手続きに従って、できるだけ早く処理します。
  2. 免責事項:この記事に表明された見解や意見は著者自身のものであり、投資アドバイスを構成するものではありません。
  3. この記事の他の言語版は、特に記載がない限り、Gate Learn チームによって翻訳されています。ゲートこのような状況下では、翻訳された記事をコピー、配布、または盗用することが禁止されています。
今すぐ始める
登録して、
$100
のボーナスを獲得しよう!
It seems that you are attempting to access our services from a Restricted Location where Gate is unable to provide services. We apologize for any inconvenience this may cause. Currently, the Restricted Locations include but not limited to: the United States of America, Canada, Cambodia, Thailand, Cuba, Iran, North Korea and so on. For more information regarding the Restricted Locations, please refer to the User Agreement. Should you have any other questions, please contact our Customer Support Team.