今日このニュースはAI界を直接震撼させました!@SentientAGI がプリンストン大学とUTオースティンを引き連れて、SPIN-Benchという新しいプロジェクトを始めたんです。最初は「数式だらけの学術的な無駄話」だと思っていたんですが、よく見てみると——完全に混乱させられました!



簡単に言うと、これはAIのための「社会大学」で、特に「人情世故版ゲーム」を教えるものです:一つのAIが問題を解くのではなく、複数のAIが集まって「大乱闘」を行い、協力しつつも競い合い、さらに交渉もできなければなりません——つまり、ChatGPTに問題集を置いて《三国殺》をプレイさせるようなもので、カードを覚えるだけでなく、仲間が内奸でないか、敵が騙してこないかを推測する必要があります!

以前はAIのテストがどれほどいい加減だったか?一問一答は100メートル走のようで、走り終えたらそれで終わり。今はSPIN-Benchが「トライアスロンPLUS」レベルに引き上げられた:長期的な戦略を計画する必要がある(例えば、どうやって同盟を結ぶか)、猪の仲間に適応し、敵の背中を刺されないようにし、突発的な状況に耐えなければならない——これは試験ではなく、明らかにAIに「江湖のギャング」に混じってもらうためだ!

彼の名前にはすべての小さな考えが詰まっている:SPIN=戦略的計画(後ろを計算する)、相互作用(おしゃべりができる)、交渉(値切りができる)——人間の言葉に訳すと、AI版『ゲーム・オブ・スローンズ』の生存ガイド!長期のタスクを分解する(クリア方法を計画するような)、人とチェスを指す(純粋にお互いを陥れる)、次に協力型カードゲームをプレイする(隠して言えない)、最後には外交を行う(今日はあなたと同盟を結んで、明日にはあなたを売るかもしれない)、すべてのステップでAIに真剣に考えさせる必要があり、単に計算能力を積み上げるだけでは通用しない!

しかもこの作業は特にハードコアです:すべてのAIは「状況を見て→メッセージを送信→本業を行う」というプロセスを経なければならず、メッセージには文字数が制限され、時間は10秒のみ——ゲームをしている時に仲間に「タワーを盗みに行くから、君たちは耐えて」と言いたいのに、相手に見られるのが怖くて焦る場面と全く同じで、まさに「AI社交高考」です!

さらに驚くべきことに、テストのたびにすべての記録(誰が何をした、何を言った、どんな報酬を得たか)を取っています。賢く振る舞ってごまかそうとしていますか?そんなことは不可能です!あなたは本当に社交を理解しているのか、それとも装っている「AI老油条」なのか、ログを一度チェックすればすべてがばれます!

最も重要なのは、このものが初めてAIの「ソーシャルIQ」を測定できることです!以前はAIを測るのは「問題を解けるかどうか」でしたが、今は「人間としての行動ができるかどうか」です——ついにAIが本当に人間の感情や世俗を理解しているのか、それとも原稿を読むだけの「機械の口」を持っているのかを理解できるようになりました!これがAIの「本当の賢さ」を測るための究極のテストです!

@SentientAGI
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)