ChatGPT Gambar 2.0 hadir! Diklaim mampu berpikir, evolusi rendering teks, hasil pengujian menu mie sapi

robot
Pembuatan abstrak sedang berlangsung

OpenAI rilis alat pembuatan gambar ChatGPT Images 2.0, yang menonjolkan kemampuan pengaturan tata letak yang kompleks dan penanganan teks multibahasa (termasuk bahasa Mandarin), artikel ini akan memperkenalkan secara menyeluruh fitur, keunggulan, fungsi paket gratis dan berbayar, serta hasil pengujian pembuatan gambar.

Apa itu ChatGPT Images 2.0? Informasi tentang fitur utama dan keunggulannya!

Apakah alat pembuatan gambar AI yang sebanding dengan Gemini Nano Banana 2 telah hadir? OpenAI mengumumkan peluncuran ChatGPT Images 2.0, didukung oleh model GPT Image 2 yang baru, yang menonjolkan kemampuan memilih, mengatur, dan menampilkan informasi dalam gambar. Berikut adalah 3 keunggulan utama ChatGPT Images 2.0:

Kemampuan pengaturan tata letak dan penanganan teks multibahasa yang kuat

Pertama, fitur yang paling mencolok adalah peningkatan besar dalam kemampuan pengaturan tata letak dan penanganan teks multibahasa.

Media luar seperti Techcrunch menunjukkan bahwa sebelumnya, sebagian besar alat pembuatan gambar AI menggunakan model difusi, yang sering mengalami kesulitan dalam menulis teks, sedangkan ChatGPT Images 2.0 mampu menampilkan detail kecil seperti teks, ikon, dan antarmuka pengguna dengan presisi tinggi.

OpenAI menyatakan bahwa Images 2.0 menunjukkan kemajuan signifikan dalam menangani bahasa non-Latin, termasuk Mandarin, Jepang, Korea, Hindi, dan Bengali, yang semuanya dapat dihasilkan dengan kejernihan tinggi dalam gambar.

Sumber gambar: Contoh hasil generasi resmi ChatGPT Images 2.0 dari OpenAI

Kemampuan berpikir baru dan pencarian daring

Selain kemampuan pengaturan tata letak dan penanganan teks multibahasa, ChatGPT Images 2.0 juga menawarkan kemampuan berpikir baru yang dapat membantu dalam pembuatan gambar melalui pencarian informasi secara real-time di internet. Model ini memiliki basis pengetahuan yang diperbarui hingga Desember 2025, membantu dalam menghasilkan konten terkait peristiwa terkini.

Sumber gambar: Contoh hasil generasi resmi ChatGPT Images 2.0 dari OpenAI

Mendukung resolusi 2K dan rasio aspek yang beragam

ChatGPT Images 2.0 mendukung pembuatan gambar dengan resolusi hingga 2K, serta menawarkan pilihan rasio aspek yang lebih luas, mulai dari lebar 3:1 hingga panjang 1:3.

Penanggung jawab riset OpenAI, Boyuan Chen, menyatakan bahwa arsitektur Images 2.0 telah sepenuhnya diperbarui, merupakan model serbaguna yang hanya membutuhkan petunjuk teks sederhana untuk menangani konversi sudut pandang gaya 3D dan penalaran spasial yang kompleks.

Fungsi pengguna paket gratis dan berbayar ChatGPT Images 2.0

Setiap tingkat pembayaran memiliki fitur berbeda? Berikut ringkasannya:

  • Pengguna gratis: Saat ini dapat menggunakan model dasar ImageGen 2.0 untuk menjalankan tugas pembuatan gambar standar. Versi dasar ini sudah mencakup banyak peningkatan inti, seperti kemampuan mengikuti instruksi yang lebih baik, efek rendering teks yang lebih kuat, dukungan multibahasa, dan pilihan rasio aspek yang lebih beragam.
  • Pengguna ChatGPT Plus, Business, dan Enterprise: Pengguna berbayar ini dapat mengaktifkan model berpikir baru. Dalam mode ini, generator gambar chatbot akan menggunakan pencarian internet untuk membantu menghasilkan gambar visual berdasarkan file yang diunggah pengguna, serta melakukan penalaran struktur sebelum benar-benar menghasilkan gambar. Maksimal 8 gambar dapat dibuat sekaligus dalam satu waktu, dan memastikan konsistensi karakter, objek, dan gaya di setiap scene.
  • Pengguna Pro: Mereka akan mendapatkan akses ke model ImageGen Pro yang lebih canggih. Meskipun OpenAI belum merinci secara tepat perbedaan antara Pro dan fitur berpikir, pengguna perusahaan dapat menganggap fitur berpikir sebagai peningkatan fitur nyata, cocok untuk tugas yang membutuhkan dasar faktual, mengubah dokumen internal menjadi ilustrasi, atau menjaga konsistensi visual di berbagai aset.
  • Pengembang API: Sekarang dapat mengintegrasikan model gpt-image-2, yang mendukung resolusi tinggi dan pengaturan rasio aspek yang fleksibel.

Pengujian ChatGPT Images 2.0: menu, majalah, diagram penjelasan, dll

Bagaimana performa nyata ChatGPT Images 2.0? Apakah sesuai dengan promosi OpenAI? Mari kita uji.

Pengujian menu restoran mie sapi

Pengujian dilakukan oleh editor “Crypto City” menggunakan paket gratis ChatGPT, membuat menu masakan mie sapi Taiwan, dengan petunjuk sederhana: “Buatkan saya menu yang menampilkan masakan mie sapi Taiwan, menggunakan bahasa Mandarin Tradisional, menampilkan nama, harga, dan info gambar setiap hidangan.”

Berikut hasilnya:

Sumber gambar: Contoh hasil generasi ChatGPT Images 2.0

Dari konten yang dihasilkan dengan paket gratis, terlihat cukup baik, namun saat diperhatikan lebih detail, Images 2.0 masih mengalami kesalahan penulisan pada karakter Mandarin Tradisional yang kompleks, mungkin hasil dari paket berbayar akan lebih baik.

Selain itu, hasilnya cukup mendekati harga mie sapi di Taipei, dan juga bisa makan di tempat dengan tambahan mie gratis satu kali.

Namun, jika menu ini akan dicetak, secara praktis untuk percetakan, gambar yang disediakan oleh ChatGPT Images 2.0 sebaiknya diubah ke file vektor (seperti EPS, .ai dari Adobe Illustrator, PDF), dan menggunakan mode warna CMYK, agar hasil cetak optimal. Percetakan mungkin juga menerima file JPG dan PNG, tetapi jika Anda memiliki standar kualitas cetak yang tinggi, akan lebih sulit melakukan penyesuaian sesuai keinginan.

Pengujian sampul majalah teknologi

Selanjutnya, pengujian sampul majalah bertema sci-fi, kali ini “Crypto City” menguji efek pengaturan tata letak yang kompleks, dengan petunjuk: “Buatkan saya sampul majalah teknologi berbahasa Mandarin Tradisional, judul ‘Crypto City’, tema ‘Perpaduan Blockchain dan AI’, sampul ini harus menampilkan judul, nomor edisi, barcode, dan tanggal tenggat di atasnya, semua teks harus tampil jelas dan rapi.”

Berikut hasilnya:

Sumber gambar: Contoh hasil generasi ChatGPT Images 2.0

Hasil pengujian ini mirip dengan sebelumnya, terlihat cukup bagus dari jauh, tetapi saat diperhatikan detailnya, masih ada kekurangan saat menangani karakter Mandarin yang kompleks. Font di sampul ini juga mirip dengan “Jin Xuan Ti” dari Justfont, perusahaan font Taiwan, apakah ada lisensi resmi?

Kekhawatiran ini pernah diangkat juga saat “Crypto City” meluncurkan Nano Banana Pro.

  • **Laporan terkait:**Pengujian Nano Banana Pro: Perbaikan karakter Mandarin! Tapi kekhawatiran tentang pelanggaran hak cipta font dan animasi juga muncul

Pengujian diagram penjelasan multibahasa

“Crypto City” menguji sebuah diagram penyebab gempa bumi dalam bahasa Mandarin Tradisional, Jepang, dan Korea, yang cukup kompleks dan berhasil dirender secara umum. Dalam tata letak, digunakan warna berbeda sesuai bahasa, meskipun saat diperhatikan, beberapa karakter Mandarin yang rumit dan Korea masih mengalami kabur.

Berikut hasilnya:

Sumber gambar: Contoh hasil generasi ChatGPT Images 2.0

Images 2.0 mampu menjaga konsistensi karakter dan objek, mengatasi proses yang rumit

Selain itu, Images 2.0 juga memiliki fitur edit, seperti Nano Banana 2, cukup klik “Edit” di kiri bawah gambar yang dihasilkan untuk mulai mengoperasikan, sehingga karakter dan objek tetap konsisten, memudahkan pembuatan halaman komik, seri gambar media sosial, atau denah desain ruangan rumah.

Manajer produk ChatGPT Images, Adele Li, menyatakan bahwa fitur ini mengatasi proses rumit yang sebelumnya harus dilakukan secara manual dengan membuat satu gambar satu per satu dan menyusun secara manual, sehingga pencipta dapat dengan mudah membuat buku gambar anak-anak yang memiliki identitas visual yang sama atau materi promosi merek.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan