اختبار OpenAI لنموذج الصور الجيل الجديد gpt-image-2، مع التركيز على الرسوم البيانية المعقدة والواقعية

robot
إنشاء الملخص قيد التقدم

21 أبريل، أعلنت شركة OpenAI أن النموذج الجديد لتوليد الصور من الجيل القادم، والذي يُطلق عليه اسم رمزي ظهر في قوائم الأطراف الثالثة، قد تم اختباره بالفعل من قبل بعض مستخدمي ChatGPT، ومن المتوقع أن يتم إصداره رسميًا خلال الأسابيع القادمة.
ذكر مصدر مطلع أن هناك تحسينين رئيسيين. الأول هو قدرة محسنة على التعامل مع الرسوم البيانية المعقدة. على سبيل المثال، وضع الملصقات أو النصوص بدقة في مواقع محددة على السبورة البيضاء، وهو شيء لم يكن النموذج السابق قادرًا على القيام به بشكل جيد. الثاني هو أن المخرجات لم تعد تحمل «إحساس الذكاء الاصطناعي»، حيث كانت الإضاءة المثالية وملامح الوجه الممشطة سابقًا تعتبر عيوبًا معروفة.
الخلفية وراء النموذج الجديد هي ضغط نمو المستخدمين لدى OpenAI. حيث توقف عدد المستخدمين النشطين يوميًا على ChatGPT عند حوالي 920 مليون، مما أدى إلى فشل الشركة في تحقيق هدفها المتمثل في الوصول إلى مليار مستخدم بحلول نهاية عام 2025. في نهاية العام الماضي، أطلقت سام ألتمان إنذارًا داخليًا في الشركة، حيث كان السبب هو انتشار نموذج الصور من جوجل Nano Banana، وأُدرج تحسين توليد الصور كأولوية ضمن «الرمز الأحمر».
تأمل OpenAI في تكرار «لحظة جيبلي» التي حدثت في بداية عام 2025، حين تدفق مئات الملايين من المستخدمين على ChatGPT لتحويل صور أنفسهم وأصدقائهم إلى أسلوب جيبلي. بعد تحسين قدرات التوليد النصي، يمكن الآن استخدام الصور بشكل أكثر موثوقية في الإعلانات والرسوم البيانية التعليمية. هذا يمثل أحد الاتجاهات التي تميز OpenAI عن شركة Anthropic، التي مؤخرًا تفوقت على OpenAI من حيث الإيرادات بفضل نماذج البرمجة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت