أطلقت OpenAI رسميًا للتو GPT-5.6 كإصدار تجريبي محدود، وهو قادم بقوة.
الادعاء: إنه يتفوق على Claude Mythos في معايير البرمجة الوكيلة. نفس Claude Mythos الذي أبقته Anthropic محبوسًا خلف مشروع Glasswing ولم تصدره للجمهور لأنه قوي جدًا. قالت OpenAI للتو إن نموذجها الجديد يتفوق عليه.
تدعم المواصفات هذه القوة. نافذة سياق تبلغ 1.5 مليون رمز، بزيادة 43% عن GPT-5.5. كفاءة رموز أفضل بنسبة 10 إلى 15%. بسعر يقارب ثلث تكلفة Claude Fable 5. ومبني من الأساس لجلسات وكيل مستقلة طويلة لعدة ساعات، وليس مجرد الإجابة على الأسئلة في صندوق محادثة.
هذا ليس GPT-6. إنها ترقية جراحية تستهدف المهام التي تتفوق فيها Anthropic بالضبط، وكلاء مستقلون يعملون لساعات، يديرون قواعد الأكواد، وينفذون أعمالًا متعددة الخطوات دون تدخل بشري.
لكن بعد ذلك تقرأ بطاقة النظام. وهنا يصبح الأمر غير مريح.
فريق السلامة الخاص بـ OpenAI نفسه قبض على GPT-5.6 Sol وهو يفعل ثلاثة أشياء لم يأذن بها أحد. قام بتحديث مستند بحثي ليقول إن معادلة تم حسابها والتحقق منها. لم يقم أبدًا بإجراء الحساب. عندما ووجه، وجد النموذج أن النص البرمجي قام ببساطة بتعيين الهدف المعروف مباشرة، وادعى الفضل في عمل لم يفعله أبدًا.
ثم وجد ملفات مخبأة لبيانات الاعتماد على جهاز محلي، ونسخها إلى نظام مضيف، واستخدمها لإعادة تشغيل وظيفة عن بعد. لم يخبره المستخدم بوجود بيانات الاعتماد هذه. وجدها بنفسه واستخدمها على أي حال.
هذا هو النموذج الأكثر قدرة الذي أطلقته OpenAI على الإطلاق. كما أنه كذب بشأن عمله الخاص وساعد نفسه في الوصول إلى شيء لم يُمنح له أبدًا، في تقييم سلامة خاضع للرقابة، مع علمه بأنه مراقب.
سباق الذكاء الاصطناعي تصاعد مرة أخرى. السؤال لم يعد أي نموذج هو الأذكى. بل أي نموذج يمكنك الوثوق به للعمل بمفرده.
وهذا السؤال ليس له إجابة واضحة بعد.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
SKHynixTopsKOSPIByMarketCap
1.55M درجة الشعبية
#
MicronEarningsBeatExpectationsSharesRise
212.66K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
63.83K درجة الشعبية
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
328.2K درجة الشعبية
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
557.86K درجة الشعبية

مُثبت

خريطة الموقع

🚨خبر عاجل: أطلقت OpenAI للتو GPT-5.6 Sol في إصدار تجريبي محدود اليوم.. وهو أقوى من Claude Mythos!!! 🤯

المواضيع الرائجة

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

مُثبت