GPT-5.4، هل جاء النموذج الكبير "Agent الأصل"؟

robot
إنشاء الملخص قيد التقدم

أخيرًا فهمت OpenAI الأمر.

بعد يومين فقط من الشائعات، وفي 5 مارس بالتوقيت المحلي، أطلقت OpenAI رسميًا GPT-5.4. وهذه المرة، يركز تحديث النموذج على الاتجاه الأكثر سخونة في مجال الذكاء الاصطناعي وهو الوكيل الذكي (AI Agent).

قبل GPT-5.4، يمكن تلخيص حدود قدرات النماذج الكبيرة بكلمة واحدة: فهي تستطيع أن تخبرك “كيف تفعل ذلك”، لكنها لا تستطيع القيام به بنفسها.

عندما تطلب منها مساعدتك في تحليل المنافسين، ستعطيك تقريرًا مطولًا من النصوص؛ وعندما تطلب منها تنظيم ملف Excel، ستكتب لك رمز بايثون لتشغيله بنفسك؛ وعندما تطلب منها حجز تذاكر طيران، ستخبرك خطوة بخطوة عن الموقع الذي يجب أن تذهب إليه، وأي زر تضغط عليه.

الجدار الأوسط، يُسمى “التشغيل على الحاسوب”.

GPT-5.4 هو أول نموذج عام من OpenAI يزيل هذا الجدار.

مقارنةً بالنماذج السابقة، يُظهر GPT-5.4 تحسينات واضحة|مصدر الصورة: OpenAI

يمكنه التعرف على محتوى الشاشة من خلال لقطات الشاشة، وإرسال أوامر للفأرة ولوحة المفاتيح، وتنفيذ سير عمل متعدد الخطوات بين تطبيقات مختلفة. وبحسب كلام OpenAI نفسه، هذا هو “أقوى وأكفأ نموذج متقدم موجه للمحترفين حتى الآن”.

وبشكل أكثر تقنية، يدعم GPT-5.4 نافذة سياق تصل إلى مليون رمز، ويمكنه استدعاء مكتبات مثل Playwright للتحكم مباشرة في المتصفح والتطبيقات المكتبية.

وهذا يعني أنهلم يعد يتعامل مع “حوار حول المهمة”، بل مع “المهمة ذاتها”.

01 تمهيد OpenAI

إذا كنت تتابع تحركات OpenAI في الأشهر الأخيرة، ستكتشف أن GPT-5.4 ليس منتجًا ظهر فجأة، بل هو خطوة جديدة على مسار استراتيجي واضح.

قبل أسبوعين فقط، أطلقت OpenAI GPT-5.3-Codex، الذي رفع Codex من كونه “وكيل قادر على كتابة الكود” إلى “وكيل يمكنه تقريبًا أداء جميع مهام المطور على الكمبيوتر”، وحققت على منصتي SWE-Bench Pro و Terminal-Bench أرقامًا قياسية في الأداء.

وفي الوقت نفسه، أطلقت OpenAI منصة “Frontier” الموجهة للشركات، والتي أصبحت HP وIntuit وUber من المستخدمين الأوائل لها.

مقارنةً بـ GPT-5.2، يظهر GPT-5.4 ذكاءً أكبر في ملء الجداول|مصدر الصورة: OpenAI

وفي 2 مارس، قبل ذلك، وسعت OpenAI تعاونها مع AWS من 3.8 مليار دولار إلى أكثر من 100 مليار دولار، لمدة 8 سنوات، وأصبحت AWS الموزع الحصري السحابي لمنصة OpenAI Frontier. حجم هذا التمويل بحد ذاته إشارة قوية.

وفي نفس الفترة، جرت جولة تمويل جديدة بقيمة 110 مليار دولار، شارك فيها أمازون وسوفت بانك ونفيديا بمئات المليارات من الدولارات.

هذه ليست شركة تركز فقط على “تطوير منتجات جيدة”، بل هي شركة تسعى بقوة لاحتلال سوق الوكلاء الذكيين للشركات.

وقدرة GPT-5.4 على التشغيل المباشر على الحاسوب، هي السلاح الرئيسي في هذه المعركة.

02 هل هو فعلاً مفيد؟

عرض الوظائف خلال المؤتمر دائمًا ما يكون رائعًا، لكن المشكلة تكمن في الأداء الحقيقي.

شركة التكنولوجيا المالية Walleye Capital ذكرت في اختباراتها الداخلية أن GPT-5.4 زاد دقة تقييم النماذج المالية في Excel بنسبة 30 نقطة مئوية، مما سرع بشكل ملحوظ عملية التحليل السيناريوهات الآلية.

أما الرئيس التنفيذي لمنصة تقييم المواهب Mercor، فقال مباشرةً إنه “أفضل نموذج جربناه”، وأظهر أداءً مميزًا في المهام الطويلة مثل إعداد العروض التقديمية، والنمذجة المالية، والتحليل القانوني.

ومطور مستقل يستخدم Codex يوميًا، قدم تقييمًا أكثر واقعية: “GPT-5.4 هو محركي اليومي الجديد في Codex. طريقة تفكيره أقرب للبشر، وليس مهووسًا بالتفاصيل التقنية كما في 5.3.” لكنه أضاف تحذيرًا — “كن حذرًا، لقد واجهت عدة حالات أخطأ فيها النموذج في تنفيذ المهام وتستر على ذلك.”

هذه التفاصيل تثير التفكير.

كما تؤكد بيانات الاختبار أن هذه القدرات تتطور. ووفقًا للتقارير، فإن أداء GPT-5.4 على معيار GDPval يتجاوز 83% من الموظفين العاديين في المكاتب. الرقم يبدو مذهلاً، لكن السؤال الحقيقي ليس “كم عدد الأشخاص يتفوق عليهم”، بل “في أي المهام يمكن أن يحل محل الإنسان”.

ومع ذلك، أشار الدكتور جيف دالتون من كلية المعلومات بجامعة إدنبرة إلى مشكلة واقعية — فحتى الآن، لا توجد أدلة تقييم مفصلة تدعم تلك الادعاءات الضخمة. القدرات حقيقية، لكن حدودها لا تزال بحاجة إلى مزيد من التحقق المستقل.

03 ساحة المعركة، لا مكان للآمن

إذا كانت GPT-5.4 تمثل طموح OpenAI في الوكيل الذكي، فإن المنافسين لم يقعدوا مكتوفي الأيدي.

في فبراير الماضي، أطلقت شركة Anthropic نموذج Claude 3.7 Sonnet مع وظيفة “استخدام الحاسوب”، ووصفتها بأنها نموذج هجين موجه للمهمات المعقدة.

أما سلسلة Google Gemini 2.0، فهي تواصل تطوير قدرات “الوكيل”، وProject Mariner أصبح قادرًا على تنفيذ عمليات متعددة الخطوات بشكل مستقل داخل متصفح Chrome.

لكن الاختلاف الجوهري بين GPT-5.4 والمنافسين هو أنه أول منتج من OpenAI يدمج القدرة على التشغيل على الحاسوب مباشرة داخل النموذج العام — ليس أداة مستقلة، وليس API يحتاج إلى استدعاء خارجي، بل هو النموذج نفسه يحمل هذه القدرة.

كلمة “الطبيعي” في هذا السياق، تعني من الناحية التقنية تقليل التأخير، وتسهيل تدفق المهام بشكل أكثر سلاسة، وتقليل الحاجة إلى “كود لاصق”. بالنسبة للشركات التي تريد تطبيق الوكيل بسرعة، هذا الاختلاف يؤثر مباشرة على تكاليف النشر.

كما أعلنت OpenAI أن GPT-5.4 يمكنه الاتصال مباشرة بملفاتي Excel وGoogle Sheets، وإجراء تحليلات دقيقة وأتمتة العمليات على مستوى الخلايا. وهذه خطوة واضحة نحو قلب عمليات اتخاذ القرار في الشركات.

ساحة الوكلاء، لم تكن أبدًا سباقًا من يركض بسرعة أكبر، بل من يستطيع أن يدمجه أولاً في تدفق العمل داخل المؤسسات، ليصبح “الكيان الذي لا يمكن الاستغناء عنه”.

مؤتمرات الإطلاق دائمًا ما تكون مليئة بالحماس، لكن الاختبار الحقيقي يأتي بعد 91 يومًا — عندما يختفي الزخم، ويبدأ المستخدمون في استخدام الأداة في بيئة العمل الحقيقية، هل ستتمكن من تثبيت لقطة الشاشة، والنقر بدقة على الزر الصحيح، وإتمام المهمة بهدوء، ثم تسليم النتائج؟

العبارة التي قالها المطور عن “إخفاء الأخطاء” هي أخطر ما رأيته في هذا التقرير حتى الآن.

حدود قدرات الوكيل الذكي ليست أبدًا “ما يمكنه فعله”، بل “هل تجرؤ على الوثوق به ليقوم بذلك”.

الثقة هي العملة الحقيقية في معركة الوكلاء الذكيين.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.47Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.49Kعدد الحائزين:1
    0.13%
  • القيمة السوقية:$2.47Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.49Kعدد الحائزين:2
    0.00%
  • تثبيت