اليوم هذه الأخبار فجرت مباشرة دائرة الذكاء الاصطناعي! @SentientAGI الارتفاع مع برينستون، UT Austin قاموا بعمل شيء جديد يسمى SPIN-Bench، في البداية اعتقدت أنه "أدب أكاديمي مليء بالمعادلات الفارغة"، لكن عندما نظرت عن كثب - جعلوني في حيرة!
ببساطة، هذه اللعبة هي "جامعة اجتماعية" مخصصة للذكاء الاصطناعي، تعلمهم كيفية اللعب بـ "لعبة العلاقات الإنسانية": ليست مجرد ذكاء اصطناعي يحل المشاكل بمفرده، بل مجموعة من الذكاء الاصطناعي تتجمع معًا في "معركة فوضوية"، يجب عليهم التعاون والتنافس، ويجب أن يعرفوا كيفية التفاوض - مما يعادل جعل ChatGPT يترك بنك الأسئلة للعب "سلاسل الممالك الثلاث"، يجب عليهم أن يتذكروا بطاقات اللعبة، وكذلك تخمين ما إذا كان زملاؤهم في الفريق خونة، وما إذا كان الخصوم يمكن أن يخدعوه!
كيف كانت اختبارات الذكاء الاصطناعي في السابق؟ كانت مجرد سؤال وجواب كما في سباق 100 متر، تنتهي بمجرد الانتهاء. الآن، SPIN-Bench ارتفع مباشرة إلى مستوى "ترايثلون بلس": يجب التخطيط لاستراتيجيات طويلة الأمد (مثل كيفية التحالف)، والتكيف مع الأصدقاء غير الأكفاء، والحذر من طعنات المنافسين من الخلف، ويجب أيضاً التعامل مع الظروف الطارئة - وليس هذا اختباراً، بل من الواضح أنه يُطلب من الذكاء الاصطناعي أن يتنقل في "عالم العصابات"!
إن اسمه مليء بالأفكار الصغيرة: SPIN = التخطيط الاستراتيجي (يعرف كيفية حساب المسار الخلفي)، التفاعل (يعرف كيفية الدردشة)، المفاوضات (يعرف كيفية المساومة) - بعبارة أخرى، هو دليل للبقاء في لعبة العروش النسخة الذكية! من تفكيك المهام الطويلة (مثل التخطيط لكيفية إنهاء المستويات)، إلى لعب الشطرنج مع الآخرين (تنافس حقيقي)، ثم إلى لعب بطاقات التعاون (يحتفظ بالأسرار ولا يجرؤ على الإفصاح بالكامل)، وأخيرًا يجب أن يتعامل مع الدبلوماسية (اليوم نتعاون، وغدًا قد أبيعك)، كل خطوة تتطلب من الذكاء الاصطناعي التفكير بجد، ليس فقط تراكم القوة الحاسوبية.
و هذه المهمة صعبة للغاية: يجب على كل AI اتباع عملية "راقب الوضع → أرسل رسالة → قم بالعمل الصحيح"، كما أن الرسائل محدودة بعدد الكلمات، والوقت المسموح به هو 10 ثوانٍ - تمامًا مثلما تريد أن تخبر زملائك في اللعبة "سأسرق البرج، ابقوا مستقرين"، لكنك تخاف أن يراك الآخرون، فهي بالفعل مشهد يثير التوتر، إنها "امتحان اجتماعي عالي للذكاء الاصطناعي"!
الأكثر إثارة للاهتمام هو أنه يتم تسجيل كل شيء في كل اختبار (من يفعل ماذا، يقول ماذا، يحصل على ماذا من المكافآت). هل تعتقد أنك ذكي بما يكفي لتجاوز الاختبار؟ لا يوجد أمل! هل أنت حقاً تفهم التواصل الاجتماعي، أم أنك تتظاهر بذلك مثل "AI老油条"، بمجرد التحقق من السجلات ستكشف كل شيء!
الأهم من ذلك، أن هذه اللعبة تستطيع لأول مرة تقييم "الذكاء الاجتماعي" للذكاء الاصطناعي! سابقًا، كان يتم اختبار الذكاء الاصطناعي من خلال "رؤية ما إذا كان بإمكانه حل المسائل"، أما الآن فهو "رؤية ما إذا كان بإمكانه التعامل مع الناس" - أخيرًا يمكننا فهم ما إذا كان الذكاء الاصطناعي يفهم حقًا الأمور الاجتماعية، أم أنه مجرد "آلة تتحدث" تقرأ النصوص! هذه هي الورقة النهائية لاختبار "الذكاء الحقيقي" للذكاء الاصطناعي!
@SentientAGI
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
اليوم هذه الأخبار فجرت مباشرة دائرة الذكاء الاصطناعي! @SentientAGI الارتفاع مع برينستون، UT Austin قاموا بعمل شيء جديد يسمى SPIN-Bench، في البداية اعتقدت أنه "أدب أكاديمي مليء بالمعادلات الفارغة"، لكن عندما نظرت عن كثب - جعلوني في حيرة!
ببساطة، هذه اللعبة هي "جامعة اجتماعية" مخصصة للذكاء الاصطناعي، تعلمهم كيفية اللعب بـ "لعبة العلاقات الإنسانية": ليست مجرد ذكاء اصطناعي يحل المشاكل بمفرده، بل مجموعة من الذكاء الاصطناعي تتجمع معًا في "معركة فوضوية"، يجب عليهم التعاون والتنافس، ويجب أن يعرفوا كيفية التفاوض - مما يعادل جعل ChatGPT يترك بنك الأسئلة للعب "سلاسل الممالك الثلاث"، يجب عليهم أن يتذكروا بطاقات اللعبة، وكذلك تخمين ما إذا كان زملاؤهم في الفريق خونة، وما إذا كان الخصوم يمكن أن يخدعوه!
كيف كانت اختبارات الذكاء الاصطناعي في السابق؟ كانت مجرد سؤال وجواب كما في سباق 100 متر، تنتهي بمجرد الانتهاء. الآن، SPIN-Bench ارتفع مباشرة إلى مستوى "ترايثلون بلس": يجب التخطيط لاستراتيجيات طويلة الأمد (مثل كيفية التحالف)، والتكيف مع الأصدقاء غير الأكفاء، والحذر من طعنات المنافسين من الخلف، ويجب أيضاً التعامل مع الظروف الطارئة - وليس هذا اختباراً، بل من الواضح أنه يُطلب من الذكاء الاصطناعي أن يتنقل في "عالم العصابات"!
إن اسمه مليء بالأفكار الصغيرة: SPIN = التخطيط الاستراتيجي (يعرف كيفية حساب المسار الخلفي)، التفاعل (يعرف كيفية الدردشة)، المفاوضات (يعرف كيفية المساومة) - بعبارة أخرى، هو دليل للبقاء في لعبة العروش النسخة الذكية! من تفكيك المهام الطويلة (مثل التخطيط لكيفية إنهاء المستويات)، إلى لعب الشطرنج مع الآخرين (تنافس حقيقي)، ثم إلى لعب بطاقات التعاون (يحتفظ بالأسرار ولا يجرؤ على الإفصاح بالكامل)، وأخيرًا يجب أن يتعامل مع الدبلوماسية (اليوم نتعاون، وغدًا قد أبيعك)، كل خطوة تتطلب من الذكاء الاصطناعي التفكير بجد، ليس فقط تراكم القوة الحاسوبية.
و هذه المهمة صعبة للغاية: يجب على كل AI اتباع عملية "راقب الوضع → أرسل رسالة → قم بالعمل الصحيح"، كما أن الرسائل محدودة بعدد الكلمات، والوقت المسموح به هو 10 ثوانٍ - تمامًا مثلما تريد أن تخبر زملائك في اللعبة "سأسرق البرج، ابقوا مستقرين"، لكنك تخاف أن يراك الآخرون، فهي بالفعل مشهد يثير التوتر، إنها "امتحان اجتماعي عالي للذكاء الاصطناعي"!
الأكثر إثارة للاهتمام هو أنه يتم تسجيل كل شيء في كل اختبار (من يفعل ماذا، يقول ماذا، يحصل على ماذا من المكافآت). هل تعتقد أنك ذكي بما يكفي لتجاوز الاختبار؟ لا يوجد أمل! هل أنت حقاً تفهم التواصل الاجتماعي، أم أنك تتظاهر بذلك مثل "AI老油条"، بمجرد التحقق من السجلات ستكشف كل شيء!
الأهم من ذلك، أن هذه اللعبة تستطيع لأول مرة تقييم "الذكاء الاجتماعي" للذكاء الاصطناعي! سابقًا، كان يتم اختبار الذكاء الاصطناعي من خلال "رؤية ما إذا كان بإمكانه حل المسائل"، أما الآن فهو "رؤية ما إذا كان بإمكانه التعامل مع الناس" - أخيرًا يمكننا فهم ما إذا كان الذكاء الاصطناعي يفهم حقًا الأمور الاجتماعية، أم أنه مجرد "آلة تتحدث" تقرأ النصوص! هذه هي الورقة النهائية لاختبار "الذكاء الحقيقي" للذكاء الاصطناعي!
@SentientAGI