広場
最新
注目
ニュース
プロフィール
ポスト
Gateアプリをダウンロードするにはスキャンしてください
その他のダウンロードオプション
今日はこれ以上表示しない
BitCommand
2025-10-20 09:42:35
フォロー
今日このニュースはAI界を直接震撼させました!@SentientAGI がプリンストン大学とUTオースティンを引き連れて、SPIN-Benchという新しいプロジェクトを始めたんです。最初は「数式だらけの学術的な無駄話」だと思っていたんですが、よく見てみると——完全に混乱させられました!
簡単に言うと、これはAIのための「社会大学」で、特に「人情世故版ゲーム」を教えるものです:一つのAIが問題を解くのではなく、複数のAIが集まって「大乱闘」を行い、協力しつつも競い合い、さらに交渉もできなければなりません——つまり、ChatGPTに問題集を置いて《三国殺》をプレイさせるようなもので、カードを覚えるだけでなく、仲間が内奸でないか、敵が騙してこないかを推測する必要があります!
以前はAIのテストがどれほどいい加減だったか?一問一答は100メートル走のようで、走り終えたらそれで終わり。今はSPIN-Benchが「トライアスロンPLUS」レベルに引き上げられた:長期的な戦略を計画する必要がある(例えば、どうやって同盟を結ぶか)、猪の仲間に適応し、敵の背中を刺されないようにし、突発的な状況に耐えなければならない——これは試験ではなく、明らかにAIに「江湖のギャング」に混じってもらうためだ!
彼の名前にはすべての小さな考えが詰まっている:SPIN=戦略的計画(後ろを計算する)、相互作用(おしゃべりができる)、交渉(値切りができる)——人間の言葉に訳すと、AI版『ゲーム・オブ・スローンズ』の生存ガイド!長期のタスクを分解する(クリア方法を計画するような)、人とチェスを指す(純粋にお互いを陥れる)、次に協力型カードゲームをプレイする(隠して言えない)、最後には外交を行う(今日はあなたと同盟を結んで、明日にはあなたを売るかもしれない)、すべてのステップでAIに真剣に考えさせる必要があり、単に計算能力を積み上げるだけでは通用しない!
しかもこの作業は特にハードコアです:すべてのAIは「状況を見て→メッセージを送信→本業を行う」というプロセスを経なければならず、メッセージには文字数が制限され、時間は10秒のみ——ゲームをしている時に仲間に「タワーを盗みに行くから、君たちは耐えて」と言いたいのに、相手に見られるのが怖くて焦る場面と全く同じで、まさに「AI社交高考」です!
さらに驚くべきことに、テストのたびにすべての記録(誰が何をした、何を言った、どんな報酬を得たか)を取っています。賢く振る舞ってごまかそうとしていますか?そんなことは不可能です!あなたは本当に社交を理解しているのか、それとも装っている「AI老油条」なのか、ログを一度チェックすればすべてがばれます!
最も重要なのは、このものが初めてAIの「ソーシャルIQ」を測定できることです!以前はAIを測るのは「問題を解けるかどうか」でしたが、今は「人間としての行動ができるかどうか」です——ついにAIが本当に人間の感情や世俗を理解しているのか、それとも原稿を読むだけの「機械の口」を持っているのかを理解できるようになりました!これがAIの「本当の賢さ」を測るための究極のテストです!
@SentientAGI
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
1 いいね
報酬
1
コメント
リポスト
共有
コメント
0/400
コメント
コメントなし
人気の話題
もっと見る
#
GateVenturesAcquiresPerpDEXADEN
20.2K 人気度
#
ETHOn-ChainActivityRises
32.3K 人気度
#
BitcoinMarketAnalysis
76.5K 人気度
#
ERC-8004IgnitesMachineEconomy
11K 人気度
#
SquareCreatorCertificationOpens
26.2K 人気度
人気の Gate Fun
もっと見る
1
GM
GMEME
時価総額:
$1.7M
保有者数:
5311
2
GCAT
GCAT
時価総額:
$395.6K
保有者数:
10611
3
TEST_SYMBOL
TEST NAME
時価総額:
$157.5K
保有者数:
264
4
芝麻开门
芝麻开门
時価総額:
$577.5K
保有者数:
138
5
GDOG
Gdog
時価総額:
$464.3K
保有者数:
22773
ピン
サイトマップ
今日このニュースはAI界を直接震撼させました!@SentientAGI がプリンストン大学とUTオースティンを引き連れて、SPIN-Benchという新しいプロジェクトを始めたんです。最初は「数式だらけの学術的な無駄話」だと思っていたんですが、よく見てみると——完全に混乱させられました!
簡単に言うと、これはAIのための「社会大学」で、特に「人情世故版ゲーム」を教えるものです:一つのAIが問題を解くのではなく、複数のAIが集まって「大乱闘」を行い、協力しつつも競い合い、さらに交渉もできなければなりません——つまり、ChatGPTに問題集を置いて《三国殺》をプレイさせるようなもので、カードを覚えるだけでなく、仲間が内奸でないか、敵が騙してこないかを推測する必要があります!
以前はAIのテストがどれほどいい加減だったか?一問一答は100メートル走のようで、走り終えたらそれで終わり。今はSPIN-Benchが「トライアスロンPLUS」レベルに引き上げられた:長期的な戦略を計画する必要がある(例えば、どうやって同盟を結ぶか)、猪の仲間に適応し、敵の背中を刺されないようにし、突発的な状況に耐えなければならない——これは試験ではなく、明らかにAIに「江湖のギャング」に混じってもらうためだ!
彼の名前にはすべての小さな考えが詰まっている:SPIN=戦略的計画(後ろを計算する)、相互作用(おしゃべりができる)、交渉(値切りができる)——人間の言葉に訳すと、AI版『ゲーム・オブ・スローンズ』の生存ガイド!長期のタスクを分解する(クリア方法を計画するような)、人とチェスを指す(純粋にお互いを陥れる)、次に協力型カードゲームをプレイする(隠して言えない)、最後には外交を行う(今日はあなたと同盟を結んで、明日にはあなたを売るかもしれない)、すべてのステップでAIに真剣に考えさせる必要があり、単に計算能力を積み上げるだけでは通用しない!
しかもこの作業は特にハードコアです:すべてのAIは「状況を見て→メッセージを送信→本業を行う」というプロセスを経なければならず、メッセージには文字数が制限され、時間は10秒のみ——ゲームをしている時に仲間に「タワーを盗みに行くから、君たちは耐えて」と言いたいのに、相手に見られるのが怖くて焦る場面と全く同じで、まさに「AI社交高考」です!
さらに驚くべきことに、テストのたびにすべての記録(誰が何をした、何を言った、どんな報酬を得たか)を取っています。賢く振る舞ってごまかそうとしていますか?そんなことは不可能です!あなたは本当に社交を理解しているのか、それとも装っている「AI老油条」なのか、ログを一度チェックすればすべてがばれます!
最も重要なのは、このものが初めてAIの「ソーシャルIQ」を測定できることです!以前はAIを測るのは「問題を解けるかどうか」でしたが、今は「人間としての行動ができるかどうか」です——ついにAIが本当に人間の感情や世俗を理解しているのか、それとも原稿を読むだけの「機械の口」を持っているのかを理解できるようになりました!これがAIの「本当の賢さ」を測るための究極のテストです!
@SentientAGI