OpenAI Luncurkan Model ChatGPT Gambar 2.0, Meningkatkan Pemrosesan Tugas Visual Kompleks

Pada 22 April, OpenAI meluncurkan model ChatGPT Images 2.0, secara signifikan meningkatkan kemampuan menangani tugas visual yang kompleks, dengan peningkatan dalam pemahaman instruksi, penempatan objek dan ekspresi hubungan, serta rendering teks dengan kepadatan tinggi. Model ini mendukung pembuatan teks multibahasa, secara akurat menampilkan konten non-Bahasa Inggris dalam gambar dan meningkatkan koherensi semantik secara keseluruhan. Dalam hal kemampuan generasi, ChatGPT Images 2.0 memungkinkan kontrol detail yang lebih halus, termasuk font kecil, ikon, elemen UI, dan komposisi kompleks, dengan resolusi output maksimum 2K. Selain itu, model ini semakin memperkuat representasi gaya dan realisme, memungkinkan pembuatan gambar yang stabil dan fotorealistik, gaya sinematik, seni piksel, dan komik, sehingga cocok untuk skenario seperti pengembangan game, desain storyboard, dan produksi materi pemasaran. Model ini memiliki kemampuan pemrosesan tugas end-to-end, menyelesaikan seluruh alur kerja mulai dari pembuatan salinan hingga komposisi desain. ChatGPT Images 2.0 kini tersedia untuk semua pengguna ChatGPT dan Codex, dengan fitur gambar yang memiliki ‘kemampuan berpikir’ yang dapat diakses oleh pengguna Plus, Pro, dan Business (Dukungan Enterprise akan segera hadir). Model dasar, gpt-image-2, juga tersedia untuk integrasi API.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan