كيف تستخدم ChatGPT Images 2.0؟ اختبار قائمة لحم البقر، غلاف مجلة، وتأثير التوعية بعدة لغات

robot
إنشاء الملخص قيد التقدم

أطلقت OpenAI أداة الصور 2.0 لـ ChatGPT، والتي تتميز بقدرات قوية في التنسيق المعقد ومعالجة النصوص متعددة اللغات (بما في ذلك الصينية)، ستقدم المقالة شرحًا شاملًا لوظائف وميزات Images 2.0، وخطط الاستخدام المجاني والمدفوع، بالإضافة إلى نتائج الاختبار الفعلي.

ما هو ChatGPT Images 2.0؟ سنوضح لك الوظائف والميزات الرئيسية!

هل جاءت أداة توليد الصور الذكية التي يمكن أن تنافس Gemini Nano Banana 2؟ أعلنت OpenAI عن إطلاق ChatGPT Images 2.0، المدعوم بنموذج GPT Image 2 الجديد، والذي يركز على إنتاج صور عالية الجودة تمتلك القدرة على الاختيار، والترتيب، والكشف عن المعلومات، وفيما يلي أهم ثلاث ميزات لـ ChatGPT Images 2.0:

قدرات تنسيق النصوص متعددة اللغات وقوية

أول ميزة واضحة هي تحسين كبير في قدرات تنسيق النصوص ومعالجة اللغات المتعددة في ChatGPT Images 2.0.

ذكرت وسائل الإعلام الأجنبية «Techcrunch» أن أدوات توليد الصور بالذكاء الاصطناعي السابقة كانت غالبًا تعتمد على نماذج الانتشار، وغالبًا ما كانت تواجه صعوبة في كتابة النصوص، لكن ChatGPT Images 2.0 يمكنه بدقة عرض النصوص الصغيرة، والرموز، وواجهات المستخدم وغيرها من التفاصيل.

قالت OpenAI إن Images 2.0 أحرز تقدمًا ملحوظًا في معالجة اللغات غير اللاتينية، بما في ذلك الصينية، واليابانية، والكورية، والهندية، والبنغالية، حيث يمكنها توليدها بوضوح عالٍ داخل الصور.

مصدر الصورة: أمثلة توليد رسمية من OpenAI لـ ChatGPT Images 2.0

قدرات تفكير جديدة والبحث عبر الإنترنت

بالإضافة إلى قدرات تنسيق النصوص ومعالجة اللغات المتعددة، يوفر ChatGPT Images 2.0 قدرات تفكير جديدة، حيث يمكنه المساعدة في توليد الصور عبر البحث الفوري على الإنترنت. قاعدة معرفته محدثة حتى ديسمبر 2025، مما يساعد على إنشاء محتوى يتناول الأحداث الأخيرة.

مصدر الصورة: أمثلة توليد رسمية من OpenAI لـ ChatGPT Images 2.0

دعم دقة 2K وتنوع نسب الطول والعرض

يدعم ChatGPT Images 2.0 توليد صور بدقة تصل إلى 2K، ويوفر خيارات أوسع لنسب الطول والعرض، من العرض 3:1 إلى الطول 1:3.

قال الباحث في OpenAI، بويوان تشن (Boyuan Chen)، إن بنية Images 2.0 قد خضعت لإعادة تصميم كاملة، وهي نموذج عام يمكنه، عبر أوامر نصية بسيطة، التعامل مع تحويلات الزوايا بأسلوب ثلاثي الأبعاد، والاستنتاجات المكانية المعقدة.

وظائف خطة الاستخدام المجاني والمدفوع لـ ChatGPT Images 2.0

هل الجودة مقابل السعر؟ تختلف الوظائف التي يمكن للمستخدمين المدفوعين من خلال مستويات مختلفة من ChatGPT Images 2.0 فتحها، والتفاصيل كالتالي:

  • المستخدمون المجانيون: يمكنهم حاليًا استخدام نموذج ImageGen 2.0 الأساسي لأداء مهام توليد الصور القياسية. النسخة الأساسية تتضمن العديد من الترقيات الأساسية، مثل تحسين التوافق مع الأوامر، وتعزيز تأثيرات النص، ودعم اللغات المتعددة، وتوفير خيارات نسب الطول والعرض المتنوعة.
  • مستخدمو ChatGPT Plus، Business، وEnterprise: يمكنهم تفعيل النموذج الجديد للتفكير. في هذا الوضع، يستخدم مولد الصور الخاص بالدردشة الإنترنت للبحث عن المعلومات، ويقوم بإنشاء رسومات تفسيرية استنادًا إلى الملفات التي يرفعها المستخدم، ويقوم بعمل استنتاجات هيكلية قبل توليد الصورة. يمكن توليد حتى 8 صور في مرة واحدة، مع ضمان التناسق في الشخصيات، والأشياء، والأساليب في كل مشهد.
  • مستخدمو Pro: يحصلون على وصول أكثر تقدمًا إلى نموذج ImageGen Pro. على الرغم من أن OpenAI لم توضح بعد الفروق الدقيقة بين Pro ووظيفة التفكير، إلا أن المستخدمين المؤسساتيين يمكنهم اعتبار وظيفة التفكير ترقية حقيقية، وتناسب المهام التي تتطلب حقائق، وتحويل المستندات الداخلية إلى رسومات تفسيرية، أو الحفاظ على التناسق البصري عبر أصول متعددة.
  • مطورو API: يمكنهم الآن دمج نموذج gpt-image-2، مع دعم دقة عالية وخيارات مرنة لنسب الطول والعرض.

اختبار ChatGPT Images 2.0: قوائم الطعام، المجلات، الرسوم التوضيحية

هل يرقى الأداء الفعلي لـ ChatGPT Images 2.0 إلى الدعاية التي تقدمها OpenAI؟ لنختبر ذلك.

اختبار قائمة طعام لوجبة لحم البقر

استخدم محرر «عاصمة التشفير» خطة مجانية من ChatGPT لاختبار، وصنع قائمة طعام لوجبة لحم البقر التايوانية، مع توجيه بسيط: «ساعدني في توليد قائمة طعام تركز على لحم البقر التايواني، ويجب أن تكون باللغة التقليدية، وتعرض أسماء الأطباق، والأسعار، والمعلومات المصورة.»

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

بالنسبة للمحتوى الذي يمكن توليده باستخدام الخطة المجانية، يبدو جيدًا من النظرة الأولى، لكن عند التدقيق ستلاحظ أن Images 2.0 لا تزال تواجه مشاكل في كتابة الحروف الصينية المعقدة، وقد تظهر أخطاء في الكتابة، وربما تكون نتائج الخطط المدفوعة أفضل.

كما أن النتائج تتقارب مع أسعار لحم البقر في تايبيه، ويمكنك أيضًا طلب إضافة نودلز مجانًا.

لكن إذا كنت تريد طباعة القائمة، فمن الأفضل تحويل الصور التي يوفرها ChatGPT Images 2.0 إلى ملفات متجهة (مثل EPS، أو ملفات .ai في أدوبي إليستريتور، أو PDF)، واستخدام ألوان CMYK، فهي الأنسب للطباعة. رغم أن المطابع قد تقبل ملفات JPG و PNG، إلا أن تلبية متطلبات الطباعة بدقة عالية قد يكون أصعب، ويصعب تعديلها لتناسب رغباتك.

اختبار غلاف مجلة تقنية

ثم نختبر غلاف مجلة خيالية، وهذه المرة اختبار «عاصمة التشفير» لمعالجة تنسيق معقد، مع توجيه: «ساعدني في توليد غلاف لمجلة تقنية باللغة التقليدية، عنوان المجلة هو «عاصمة التشفير»، موضوعها «تقاطع البلوكشين والذكاء الاصطناعي»، ويجب أن يتضمن الغلاف عنوان، رقم المجلد، وتاريخ انتهاء العرض فوق الباركود، ويجب أن تكون جميع النصوص واضحة ومحترفة في الترتيب.»

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

هذه النتيجة مشابهة للسابقة، فهي تبدو جيدة من النظرة الأولى، لكن عند التدقيق في معالجة الحروف الصينية المعقدة، لا تزال هناك بعض الأخطاء، كما أن نوع الخط المستخدم على الغلاف يشبه خط «金萱體» الخاص بمصنع الخطوط التايواني Justfont، ولا نعلم إن كان قد تم الحصول على ترخيص لذلك.

مثل هذه الشكوك، طرحتها «عاصمة التشفير» أيضًا عند إصدار Nano Banana Pro.

  • تقرير ذو صلة: اختبار Nano Banana Pro: تحسن في الحروف الصينية! لكن تظهر مخاوف من حقوق النشر للرسوم المتحركة والخطوط

اختبار الرسوم البيانية متعددة اللغات التفسيرية

اختبر «عاصمة التشفير» رسمًا بيانيًا لسبب حدوث زلزال، مكتوبًا باللغة التقليدية، اليابانية، والكورية، ونجح في تقريبًا في عرض النصوص المتعددة بشكل جيد. من ناحية التنسيق، تم تمييز اللغات المختلفة بألوان مختلفة، رغم أن بعض الحروف الصينية المعقدة، والكورية، أو الحروف الصينية التقليدية لا تزال تظهر ضبابية عند التدقيق.

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

صور 2.0 تحافظ على تماسك الشخصيات والأشياء، وتُحل مشكلة العمليات المعقدة

بالإضافة إلى ذلك، فإن Images 2.0، مثل Nano Banana 2، تتيح إمكانية التعديل، حيث يمكن ببساطة النقر على زر «تحرير» أسفل الصورة المولدة لبدء التعديل، مما يحافظ على تماسك الشخصيات والأشياء، ويسهل تصميم صفحات المانغا، أو منشورات وسائل التواصل الاجتماعي، أو مخططات تصميم غرف المنازل.

قالت Adele Li، مسؤولة منتجات ChatGPT Images، إن هذه الميزة تحل مشكلة كانت تواجه المستخدمين سابقًا، حيث كان عليهم توليد صورة واحدة يدوياً ثم تجميعها، مما يتيح للمبدعين بسهولة إنشاء كتب أطفال ذات طابع بصري موحد، أو مواد تسويقية للعلامة التجارية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت