اختبار سري لـ GPT-5.6 ينتشر بسرعة: ChatGPT يتطور ليصبح أكثر ذكاءً، واختبار المستخدمين يتفوق على Fable 5

استخدامات ChatGPT تبلّغ بشكل جماعي عن قفزة كبيرة في جودة الإخراج، وزمن الاستجابة يطول بشكل ملحوظ، مما أثار تكهنات جنونية حول اختبار OpenAI السري لنموذج الجيل التالي GPT-5.6. من توليد ألعاب ثلاثية الأبعاد بضغطة واحدة إلى محاكاة الروبوتات، نشر العديد من المطورين على منصة X مقارنات عملية، مدعين أن «Pro 5.5 تم استبداله بهدوء بـ 5.6». ويُقال إن الإصدار الرسمي قد يُطلق في أقرب وقت في 25 يونيو، لكن OpenAI لا تزال صامتة حتى الآن.
(مقدمة: نائب مسؤول عن Google Gemini ترك الشركة لينضم إلى OpenAI)
(معلومات إضافية: تدريب نسخة Mythos الجديدة من Anthropic اكتمل، وSonnet 5 سيصدر قريبًا هذا الأسبوع)

فهرس المقال

Toggle

  • المستخدمون الجماعيون يبلغون: تباطؤ في الردود، جودة عالية بشكل غير مسبوق
  • ظهور تسريبات التفاصيل: رفع قيمة Juice، تحديث تاريخ انتهاء المعرفة
  • صمت OpenAI وسجلات «الإصدار الصامت» السابقة
  • وراء التسرع في طرح النموذج الجديد: سباق GLM-5.2، قيود التصدير على Anthropic

فوجئ مستخدمو ChatGPT هذا الأسبوع باكتشاف أن جودة المحادثة تبدو مختلفة. ليست مجرد تجربة فردية صغيرة، بل تقارير واسعة من المطورين والمبدعين ووكالات التقييم، كلها تشير إلى اتجاه واحد: أن OpenAI ربما تختبر سرًا نموذجًا جديدًا.

نشر المطور Anshu Chimala على منصة X يوم الخميس مقطع فيديو يقارن جودة صفحة الدخول التي يتم إنشاؤها بضغطة واحدة، قائلاً: «حسنًا حسنًا حسنًا، أنا من المحظوظين الذين حصلوا على فرصة مبكرة لتجربة GPT-5.6 Pro». مطور آخر، Dobroslav Radosavljevič، قال على X إن النموذج الذي يستخدمه في Codex «يبدو مختلفًا تمامًا عن 5.5»، وردود الفعل في قسم التعليقات انقسمت بين من يثق تمامًا وبين من يبدي تحفظًا.

المستخدمون الجماعيون يبلغون: تباطؤ في الردود، جودة عالية بشكل غير مسبوق

الخاصية الأوضح المشتركة هي الوقت. قام المطور Conor Dart باختبار، حيث استخدم كلمة تحفيزية واحدة لإنشاء لعبة متصفح ثلاثية الأبعاد مزودة بمحرك فيزيائي وتحكم في الكاميرا، واستغرق الأمر أكثر من ساعة، بينما عادةً ما يستغرق GPT-5.5 Pro حوالي 10 دقائق. قال: «ليس مثاليًا، لكن إنجاز شيء كهذا بكلمة واحدة هو أمر يثير الإعجاب حقًا».

كما أبلغ شخص من مجتمع الذكاء الاصطناعي، Chetas Lua، على منصة X عن حالات مشابهة: عندما يختبر روبوتات المحاكاة، تتأخر الردود إلى 20 إلى 40 دقيقة، ووصف هذا الإيقاع بأنه «لم أره منذ إطلاق GPT-5.5». وأضاف بصراحة: «GPT-5.6 Pro يواصل تفوق Fable 5 من Anthropic في اختبارات 3D».

لكن ليست كل الاختبارات متساوية. قام مختبر الذكاء الاصطناعي Chris باستخدام نفس وصف بناء المركبة الفضائية لاختبار نموذجين: يُعتقد أن GPT-5.6 Pro استغرق 87 دقيقة، بينما GPT-5.5 Extra High استغرق فقط 34 دقيقة و42 ثانية. قال: «كما قلت من قبل، GPT-5.6 هو ترقية تدريجية ومستقرة على 5.5، وليس قاتل Fable. من المحتمل أن يتنافس معه في بعض المعايير، لكنه لن يتفوق بشكل واضح بشكل عام».

ظهور تسريبات التفاصيل: رفع قيمة Juice، تحديث تاريخ انتهاء المعرفة

مع تصاعد النقاش، بدأت تتداول مزيد من المعلومات المسربة. كشف مصدر تسريبات، Pankaj Kumar، عن تفاصيل متعددة حول المواصفات: تم دفع تاريخ انتهاء المعرفة إلى ديسمبر 2025؛ ويُقال إن إعداد قوة الاستدلال، المعروف باسم «Juice Value»، والذي يُقاس من 768 إلى 960؛ وقدرة توليد تصميم SVG و3D تتفوق على Fable 5 في بعض المهام. لم تؤكد OpenAI صحة هذه المعلومات، لكن الروايات عبر حسابات متعددة تتطابق بشكل كبير: قدرات استدلال أقوى، واجهة أمامية غير مكتملة، ورمز مؤقت باسم «Kindle-Alpha».

قال قائد الرأي في مجال الذكاء الاصطناعي، Leo، في منشور استنادًا إلى رسائل مجهولة المصدر، إن GPT-5.6 «يجري حاليًا اختبارًا سريًا على بعض حسابات Pro، وعند اختيار المستخدمين لـ GPT-5.5 Pro، يتم تشغيل 5.6 فعليًا»، وتوقع أن يكون موعد الإطلاق العام في 25 يونيو (الخميس).

صمت OpenAI وسجلات «الإصدار الصامت» السابقة

هذه ليست المرة الأولى التي تتبع فيها OpenAI استراتيجية «الإطلاق دون إعلان مسبق». عند استعراض عملية إصدار GPT-4.5، اختارت OpenAI أيضًا استبدال النموذج مباشرة دون سابق إنذار، حتى يكتشف المستخدمون الاختلافات، ثم تؤكد الأمر بشكل غير رسمي. هذه الاستراتيجية من نوع «الإصدار السري» تتيح للشركة جمع بيانات الاستخدام الحقيقي دون إثارة الكثير من الاهتمام، وأيضًا تتيح التراجع السري عند ظهور مشكلات، لتجنب أزمات علاقات عامة.

على عكس Anthropic، التي كانت تروج بشكل كبير عند إصدار كل نموذج، فإن Fable 5 وMythos 5 كانا يتبعان جدولًا زمنيًا واضحًا من التدريب حتى الإطلاق الرسمي، بينما تتجه إصدارات OpenAI الأخيرة أكثر نحو «العمل أولًا ثم الإعلان لاحقًا». وفقًا لتقارير، قال Jakub Pachocki، كبير العلماء، في اجتماع داخلي إن النموذج الجديد هو تحسين مهم على GPT-5.5، لكن تقرير The Information يقتصر على ذلك، ولم يؤكد أي اختبار A/B أو جدول زمني للإصدار.

من الجدير بالذكر أن Decrypt طلبت من OpenAI التعليق على الأمر، ولم تتلق ردًا حتى الآن.

وراء التسرع في طرح النموذج الجديد: سباق GLM-5.2، قيود التصدير على Anthropic

إذا كانت OpenAI بالفعل تسرع في إصدار الجيل التالي من النماذج الرائدة، فهناك ضغط تنافسي كبير وراء ذلك. النموذج المفتوح المصدر الصيني، GLM-5.2، يتأخر بنقطة واحدة فقط عن Claude Opus 4.8 على معيار FrontierSWE، وتجاوز مباشرة GPT-5.5. هذا المعيار، الذي يقيم أداء وكيل الذكاء الاصطناعي في مهام معقدة تستغرق ساعات، أصبح معيارًا جديدًا لقياس قدرات النماذج الحقيقية في الصناعة.

أما فريق Anthropic، فهو يواجه مأزقًا داخليًا. حيث تم سحب نماذجه الرائدة، Mythos 5 وFable 5، بسبب أمر تصدير أصدرته الحكومة الأمريكية في 12 يونيو، بسبب ثغرة هروب جدلية. هذا لا يخلق فقط فراغًا في سوق النماذج المتقدمة، بل يمنح OpenAI فرصة ثمينة، إذ يمكنها أن تطلق GPT-5.6 قبل أن تتمكن Anthropic من حل مشكلة قيود التصدير، وبالتالي تملأ الفراغ السوقي.

وفي الوقت نفسه، ذكرت صحيفة وول ستريت جورنال أن OpenAI تدرس تخفيضات سعرية للمطورين والشركات، استعدادًا لطرح الاكتتاب العام المزدوج القادم. مع تصاعد المنافسة واندلاع حرب الأسعار، فإن توقيت إصدار النموذج الجديد سيكون حاسمًا في سرد الشركة المالي.

مهما كانت التكهنات الجماهيرية، فإن الوحيد الذي يمكن أن يثبت وجود GPT-5.6 هو OpenAI رسميًا. لكن متداولي سوق التوقعات Polymarket، الذين لا يرغبون في الانتظار، رفعوا سعر العقود التي تتوقع إصدار GPT-5.6 بين 22 و28 يونيو إلى 89% حتى نهاية الأسبوع.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت