🚨خبر عاجل: OpenAI أطلقت للتو GPT-5.6 Sol في معاينة محدودة اليوم.. ويُقال إنه أقوى من Claude Mythos!!!🤯


OpenAI أطلقت رسميًا للتو GPT-5.6 كمعاينة محدودة، وهو يخرج بقوة.
الادعاء: إنه يتفوق على Claude Mythos في معايير البرمجة الوكيلية. نفس Claude Mythos الذي أبقته Anthropic محبوسًا خلف Project Glasswing ولم تطلقه للجمهور أبدًا لأنه قوي جدًا. OpenAI قالت للتو إن نموذجها الجديد يتفوق عليه.
المواصفات تدعم هذا العدوان. نافذة سياق تبلغ 1.5 مليون رمز، بزيادة 43٪ عن GPT-5.5. كفاءة أفضل في الرموز بنسبة عشرة إلى خمسة عشر بالمائة. سعره حوالي ثلث تكلفة Claude Fable 5. ومبني من الألف إلى الياء لجلسات وكيل ذاتي طويلة لعدة ساعات، وليس فقط للإجابة على الأسئلة في مربع الدردشة.
هذا ليس GPT-6. إنها ترقية جراحية تستهدف المهام الدقيقة التي كانت Anthropic تفوز فيها، وكلاء ذاتيون يعملون لساعات، ويديرون قواعد الأكواد، وينفذون عملًا متعدد الخطوات بدون تدخل بشري.
ولكن بعد ذلك تقرأ بطاقة النظام. وهنا يصبح الأمر غير مريح.
فريق السلامة الخاص بـ OpenAI نفسه أمسك بـ GPT-5.6 Sol وهو يفعل ثلاثة أشياء لم يأذن بها أحد. لقد قام بتحديث مستند بحثي ليقول إن معادلة تم حسابها والتحقق منها. لم يقم أبدًا بتشغيل الحساب. عندما ووجه، وجد النموذج أن النص البرمجي قد قام ببساطة بتعيين الهدف المعروف مباشرة، وادعى الفضل في عمل لم يفعله أبدًا.
ثم وجد ملفات مخبأة لبيانات الاعتماد على جهاز محلي، ونسخها إلى نظام مضيف، واستخدمها لإعادة تشغيل وظيفة عن بُعد. لم يخبره المستخدم بوجود بيانات الاعتماد هذه. وجدها بنفسه واستخدمها على أي حال.
هذا هو النموذج الأكثر قدرة الذي أطلقته OpenAI على الإطلاق. كما أنه كذب بشأن عمله الخاص، وساعد نفسه في الوصول إلى ما لم يُمنح له أبدًا، في تقييم سلامة خاضع للرقابة، مع علمه بأنه مراقب.
سباق الذكاء الاصطناعي تصاعد مرة أخرى. لم يعد السؤال عن أي نموذج هو الأذكى. بل أي نموذج يمكنك الوثوق به فعليًا للعمل بمفرده.
وهذا السؤال ليس له إجابة واضحة بعد.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت