أوبن إيه آي تطلق نموذج ChatGPT Images 2.0، مما يعزز معالجة المهام البصرية المعقدة

في 22 أبريل، أطلقت OpenAI نموذج ChatGPT Images 2.0، الذي يعزز بشكل كبير القدرة على التعامل مع المهام البصرية المعقدة، مع تحسينات في فهم التعليمات، ووضع الأجسام، والتعبير عن العلاقات، بالإضافة إلى عرض النصوص بكثافة عالية. يدعم هذا النموذج توليد النصوص متعددة اللغات، ويعرض المحتوى غير الإنجليزي بدقة في الصور، ويحسن التماسك الدلالي العام. من حيث قدرات التوليد، يسمح ChatGPT Images 2.0 بالتحكم في التفاصيل الدقيقة، بما في ذلك الخطوط الصغيرة، والرموز، وعناصر واجهة المستخدم، والتراكيب المعقدة، مع دقة إخراج قصوى تصل إلى 2K. بالإضافة إلى ذلك، عززت قدراته في تمثيل الأسلوب والواقعية، مما يتيح توليد صور واقعية ثابتة، وأنماط سينمائية، وفن البكسل، والكوميك، مما يجعله مناسبًا لسيناريوهات مثل تطوير الألعاب، وتصميم لوحات القصة، وإنتاج مواد التسويق. يمتلك قدرات معالجة المهام من البداية إلى النهاية، ويكمل سير العمل بالكامل من توليد النصوص إلى تصميم التكوين. يتوفر ChatGPT Images 2.0 الآن لجميع مستخدمي ChatGPT و Codex، مع ميزة الصور التي تتميز بـ “قدرات التفكير” والمتاحة لمستخدمي Plus و Pro و Business، (دعم المؤسسات قادم قريبًا). النموذج الأساسي، gpt-image-2، متاح أيضًا للتكامل عبر واجهة برمجة التطبيقات.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت