كيف تستخدم ChatGPT Images 2.0؟ اختبار قائمة لحم البقر، غلاف مجلة، وتأثيرات التوعية بعدة لغات

robot
إنشاء الملخص قيد التقدم

أطلقت OpenAI أداة الصور 2.0 لـ ChatGPT، التي تتميز بقدرات قوية في التنسيق المعقد ومعالجة النصوص متعددة اللغات (بما في ذلك الصينية)، ستقدم هذه المقالة شرحًا شاملًا لوظائف وميزات Images 2.0، وخطط الاستخدام المجاني والمدفوع، بالإضافة إلى نتائج الاختبار الفعلي.

ما هو ChatGPT Images 2.0؟ سنوضح لك الوظائف والميزات الرئيسية!

هل ظهرت أداة توليد الصور الذكية التي يمكن أن تنافس Gemini Nano Banana 2؟ أعلنت OpenAI عن إطلاق ChatGPT Images 2.0، المدعومة بنموذج GPT Image 2 الجديد كليًا، والذي يركز على قدرة الصور الممتازة على الاختيار، والترتيب، والكشف عن المعلومات، وفيما يلي أهم ثلاث ميزات لـ ChatGPT Images 2.0:

معالجة قوية للتنسيق والنصوص متعددة اللغات

أول ميزة واضحة هي تحسين كبير في قدرات التنسيق ومعالجة النصوص متعددة اللغات في ChatGPT Images 2.0.

ذكرت وسائل الإعلام الأجنبية «Techcrunch» أن أدوات توليد الصور بالذكاء الاصطناعي السابقة كانت غالبًا تعتمد على نماذج الانتشار، وغالبًا ما كانت تواجه صعوبة في كتابة النصوص، لكن ChatGPT Images 2.0 يمكنه بدقة عرض النصوص الصغيرة، والرموز، وواجهات المستخدم وغيرها من التفاصيل.

قالت OpenAI إن Images 2.0 أحرز تقدمًا ملحوظًا في معالجة اللغات غير اللاتينية، بما في ذلك الصينية، واليابانية، والكورية، والهندية، والبنغالية، حيث يمكنها توليدها بوضوح عالي داخل الصور.

مصدر الصورة: أمثلة توليد رسمية من OpenAI لـ ChatGPT Images 2.0

قدرات تفكير جديدة والبحث عبر الإنترنت

بالإضافة إلى قدرات التنسيق ومعالجة النصوص متعددة اللغات، يوفر ChatGPT Images 2.0 قدرات تفكير جديدة، حيث يمكنه المساعدة في توليد الصور عبر البحث الفوري عن المعلومات على الإنترنت. قاعدة معرفته محدثة حتى ديسمبر 2025، مما يساعد على إنشاء محتوى يتناول الأحداث الأخيرة.

مصدر الصورة: أمثلة توليد رسمية من OpenAI لـ ChatGPT Images 2.0

دعم دقة 2K وتنوع نسب الطول والعرض

يدعم ChatGPT Images 2.0 توليد صور بدقة تصل إلى 2K، ويوفر خيارات أوسع لنسب الطول والعرض، من العرض 3:1 إلى الطول 1:3.

قال الباحث في OpenAI، بويوان تشن (Boyuan Chen)، إن بنية Images 2.0 قد خضعت لإعادة تصميم كاملة، وهي نموذج عام يمكنه، باستخدام أوامر نصية بسيطة، التعامل مع تحويلات الزوايا بأسلوب ثلاثي الأبعاد، والاستنتاج المكاني المعقد.

وظائف خطة الاستخدام المجاني والمدفوع لـ ChatGPT Images 2.0

هل الجودة تتناسب مع السعر؟ تختلف الوظائف التي يمكن للمستخدمين المدفوعين من مختلف المستويات فتحها، والتفاصيل كالتالي:

  • المستخدمون المجانيون: يمكنهم حاليًا استخدام نموذج ImageGen 2.0 الأساسي لأداء مهام توليد الصور القياسية. النسخة الأساسية تتضمن العديد من الترقيات الأساسية، مثل تحسين التوافق مع الأوامر، وتعزيز تأثير النص، ودعم اللغات المتعددة، وتوفير خيارات نسب الطول والعرض المتنوعة.
  • مستخدمو ChatGPT Plus، Business، وEnterprise: يمكنهم تفعيل النموذج الجديد للتفكير. في هذا الوضع، يستخدم مولد الصور الخاص بالدردشة الإنترنت للبحث عن المعلومات، ويقوم بإنشاء رسومات تفسيرية استنادًا إلى الملفات التي يرفعها المستخدم، ويقوم بعمل استنتاجات هيكلية قبل توليد الصورة. يمكنه توليد حتى 8 صور في مرة واحدة، مع ضمان التناسق في الشخصيات، والأشياء، والأساليب في كل مشهد.
  • مستخدمو Pro: يحصلون على وصول أكثر تقدمًا إلى نموذج ImageGen Pro. على الرغم من أن OpenAI لم تقدم بعد تفاصيل دقيقة حول الفارق بين Pro ووظائف التفكير، إلا أن المستخدمين المؤسساتيين يمكنهم اعتبار وظيفة التفكير ترقية حقيقية، وتناسب المهام التي تتطلب حقائق، وتحويل المستندات الداخلية إلى رسومات تفسيرية، أو الحفاظ على التناسق البصري عبر أصول متعددة.
  • مطورو API: يمكنهم الآن دمج نموذج gpt-image-2، مع دعم دقة عالية وخيارات مرنة لنسب الطول والعرض.

اختبار ChatGPT Images 2.0: قوائم الطعام، المجلات، الرسوم التوضيحية

هل الأداء الفعلي لـ ChatGPT Images 2.0 يطابق الدعاية من OpenAI؟ لنختبر ذلك.

اختبار قائمة طعام لوجبة لحم البقر

استخدم محرر «عاصمة التشفير» خطة مجانية من ChatGPT لاختبار، لإنشاء قائمة طعام لوجبة لحم البقر التايوانية، مع توجيه بسيط: «ساعدني في توليد قائمة طعام تركز على لحم البقر التايواني، ويجب أن تكون باللغة التقليدية، وتعرض أسماء الأطباق، والأسعار، والمعلومات التصويرية.»

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

بالنسبة للمحتوى الذي يمكن توليده باستخدام الخطة المجانية، يبدو جيدًا من النظرة الأولى، لكن عند التدقيق ستجد أن Images 2.0 لا تزال تواجه مشكلة في كتابة الحروف الصينية المعقدة، وقد تظهر أخطاء في الكتابة، وربما تكون نتائج الخطط المدفوعة أفضل.

كما أن النتائج تتقارب مع أسعار لحم البقر في تايبيه، ويمكنك أيضًا طلب إضافة نودلز مجانًا عند تناول الطعام في المكان.

لكن إذا كنت تريد طباعة القائمة، فمن الأفضل تحويل الصور التي يوفرها ChatGPT Images 2.0 إلى ملفات متجهة (مثل EPS، أو ملفات .ai في Adobe Illustrator، أو PDF)، واستخدام ألوان CMYK، فهي الأنسب للطباعة. رغم أن المطابع قد تقبل ملفات JPG و PNG، إلا أنه إذا كانت لديك متطلبات عالية الجودة، فسيكون من الصعب تعديلها لتلبية رغباتك.

اختبار غلاف مجلة تكنولوجيا

ثم نختبر غلاف مجلة خيالية، وهذه المرة لاختبار قدرة معالجة التنسيق المعقد، مع توجيه: «ساعدني في توليد غلاف مجلة تكنولوجيا باللغة التقليدية، باسم المجلة «عاصمة التشفير»، وموضوع «تقاطع البلوكشين والذكاء الاصطناعي»، ويجب أن يتضمن العنوان، والعدد، ورمز الباركود، وتاريخ انتهاء الصلاحية فوقه، ويجب أن تكون جميع النصوص واضحة ومحترفة في الترتيب.»

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

هذه النتيجة مشابهة للنتائج السابقة، فهي تبدو جيدة من النظرة الأولى، لكن عند التدقيق في معالجة الحروف الصينية المعقدة، لا تزال هناك بعض الأخطاء، وخطوط الخط على الغلاف تشبه خط «جينغسون» من Justfont، وهو خط صيني تجاري، ولا نعلم إن كان قد تم الحصول على ترخيص له.

مثل هذا الشكوك، طرحتها «عاصمة التشفير» أيضًا عند إصدار Nano Banana Pro.

  • تقرير ذو صلة: اختبار Nano Banana Pro: تقدم في الحروف الصينية! لكن تظهر مخاوف من حقوق النشر للرسوم المتحركة والخطوط

اختبار الرسوم البيانية متعددة اللغات التفسيرية

اختبر «عاصمة التشفير» رسمًا بيانيًا يوضح أسباب حدوث زلزال، باللغة التقليدية، واليابانية، والكورية، ونجح في تقريبًا في عرض النصوص متعددة اللغات بشكل جيد. من ناحية التنسيق، استخدم ألوانًا مختلفة حسب اللغة، رغم أن بعض الحروف الصينية المعقدة أو الكورية لا تزال تظهر بشكل غير واضح عند التدقيق.

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

صور 2.0 يمكنها الحفاظ على تماسك الشخصيات والأشياء، وحل العمليات المعقدة

بالإضافة إلى ذلك، فإن Images 2.0، مثل Nano Banana 2، تتيح إمكانية التعديل، حيث يمكن ببساطة النقر على زر «تحرير» أسفل الصورة المولدة لبدء التعديل، مما يحافظ على تماسك الشخصيات والأشياء، ويسهل تصميم صفحات المانغا، أو منشورات وسائل التواصل الاجتماعي، أو مخططات تصميم غرف المنازل.

قالت Adele Li، مسؤولة منتجات ChatGPT Images، إن هذه الميزة تحل مشكلة كانت تواجه المستخدمين سابقًا، حيث كان يتعين عليهم توليد صورة واحدة يدوياً ثم تجميعها، مما يستهلك الكثير من الوقت، وتمكن المبدعين من إنشاء كتب أطفال ذات طابع بصري موحد أو مواد تسويقية للعلامة التجارية بسهولة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت