OpenAI merilis GPT-5.4 mini dan nano, mendekatkan performa model flagship dengan biaya lebih rendah

robot
Pembuatan abstrak sedang berlangsung

OpenAI hari Selasa meluncurkan dua model kecil terkuat mereka hingga saat ini, GPT-5.4 mini dan GPT-5.4 nano, yang secara signifikan memperkecil jarak performa dengan model flagship melalui latensi yang lebih rendah dan biaya yang lebih murah.

GPT-5.4 mini secara menyeluruh melampaui GPT-5 mini generasi sebelumnya dalam dimensi inti seperti pemrograman, penalaran, pemahaman multimodal, dan pemanggilan alat, dengan peningkatan kecepatan lebih dari 2 kali lipat, serta mendekati ukuran GPT-5.4 yang lebih besar dalam pengujian benchmark SWE-Bench Pro dan lainnya.

GPT-5.4 nano dirancang sebagai opsi ringan dengan biaya terendah dan latensi terpendek, hanya tersedia melalui API untuk pengembang, dan khusus dibuat untuk tugas klasifikasi data, ekstraksi, serta tugas pemrograman sederhana.

Peluncuran kedua model ini bertujuan mengisi kekosongan yang ada pada model besar dalam skenario interaksi waktu nyata yang sering terganggu oleh latensi tinggi, secara langsung mempengaruhi pasar bisnis yang berkembang pesat seperti asisten pemrograman, sistem agen AI, dan aplikasi multimodal.

mini untuk konsumen, nano API eksklusif

GPT-5.4 mini mulai hari ini tersedia secara bersamaan melalui tiga saluran utama: OpenAI API, platform Codex, dan ChatGPT.

Harga API GPT-5.4 mini adalah $0,75 per juta token input dan $4,50 per juta token output, mendukung input teks dan gambar, pemanggilan alat, fungsi, pencarian web, pencarian file, kontrol komputer, serta perluasan kemampuan, dengan jendela konteks hingga 400.000 token.

Di platform Codex, GPT-5.4 mini hanya menggunakan 30% dari kuota GPT-5.4, sehingga biaya pengolahan tugas pemrograman sederhana oleh pengembang menjadi sekitar sepertiga dari model flagship. Codex juga mendukung delegasi beban kerja ke sub-agen cerdas yang berjalan dengan GPT-5.4 mini, sehingga tugas dengan tingkat penalaran rendah secara otomatis dialihkan ke model yang lebih murah.

Di ChatGPT, pengguna Free dan Go dapat memilih fitur “Thinking” dengan menu “+” untuk menggunakan GPT-5.4 mini; pengguna berbayar lainnya setelah mencapai batas kecepatan akses GPT-5.4 Thinking, model ini akan diaktifkan sebagai opsi penurunan otomatis.

GPT-5.4 nano saat ini hanya tersedia melalui API untuk pengembang, dengan harga $0,20 per juta token input dan $1,25 per juta token output, menjadi model baru dengan harga terendah dari kedua model ini. OpenAI menyatakan bahwa nano cocok digunakan dalam skenario sub-agen cerdas yang dikendalikan oleh model tingkat tinggi dan bertanggung jawab atas tugas pendukung yang kurang kompleks.

mini mendekati flagship, nano melampaui generasi sebelumnya

Berdasarkan data pengujian yang dirilis OpenAI, GPT-5.4 mini menunjukkan performa yang sangat menonjol dalam tugas pemrograman dan multimodal.

Dalam benchmark SWE-bench Pro, mini meraih skor 54,4%, mendekati GPT-5.4 yang mencapai 57,7%, dengan selisih hanya 3,3 poin persentase, jauh lebih baik dari GPT-5 mini yang hanya 45,7%.

Dalam benchmark pengendalian komputer OSWorld-Verified, mini mencapai 72,1%, mendekati GPT-5.4 yang 75,0%, dan secara signifikan mengungguli GPT-5 mini yang hanya 42,0%.

Dalam kemampuan pemanggilan alat, GPT-5.4 mini meraih skor 93,4% dalam pengujian τ2-bench telekomunikasi, peningkatan yang signifikan dari GPT-5 mini yang 74,1%. Dalam pengujian kecerdasan umum GPQA Diamond, mini mendapatkan 88,0%, nano mencapai 82,8%, keduanya melampaui GPT-5 mini yang 81,6%.

Perlu dicatat bahwa dalam beberapa tugas visual, GPT-5.4 nano tertinggal dari GPT-5 mini, dengan skor OSWorld-Verified 39,0% dibandingkan 42,0%. Namun, dalam tugas pemrograman dan pemanggilan alat, nano tetap menunjukkan peningkatan yang jelas dibandingkan generasi sebelumnya.

OpenAI menyatakan bahwa prioritas utama nano adalah latensi rendah dan biaya rendah, bukan performa menyeluruh, sehingga pengembang harus mempertimbangkan kebutuhan spesifik tugas saat memilih model.

Arsitektur sub-agen cerdas, kolaborasi multi-model sebagai paradigma baru produk

Dalam materi peluncuran, OpenAI menekankan posisi kedua model baru ini dalam sistem berlapis multi-model.

Sebagai contoh, dengan asisten pemrograman buatan sendiri, Codex, GPT-5.4 bertanggung jawab untuk perencanaan, koordinasi, dan pengambilan keputusan akhir, sementara sub-agen cerdas GPT-5.4 mini secara paralel menangani tugas-tugas yang lebih kecil seperti pencarian basis kode, peninjauan file besar, dan asistensi dokumen.

OpenAI menyatakan bahwa dengan kecepatan dan kemampuan yang lebih baik dari model kecil, pengembang tidak perlu menggunakan satu model tunggal untuk semua tugas, melainkan dapat membangun sistem di mana model besar bertanggung jawab atas pengambilan keputusan, sementara model kecil secara cepat dan massal menjalankan tugas. OpenAI menambahkan:

GPT-5.4 mini adalah model kecil paling kuat yang pernah kami buat untuk alur kerja seperti ini.

Arsitektur ini sangat penting untuk pekerjaan dengan tingkat concurrency tinggi, seperti asisten pemrograman, analisis tangkapan layar, dan pemahaman gambar secara real-time, di mana latensi respons langsung mempengaruhi pengalaman produk. Pilihan terbaik seringkali bukan model dengan kemampuan tertinggi, melainkan model yang mampu menyeimbangkan kecepatan, keandalan alat, dan performa tugas secara optimal.

Bagi pengembang, peluncuran GPT-5.4 mini dan nano berarti jalur untuk secara signifikan menurunkan biaya inferensi tanpa mengorbankan tingkat kecerdasan sistem secara keseluruhan semakin jelas.

Peringatan risiko dan ketentuan penafian

Pasar memiliki risiko, investasi harus dilakukan dengan hati-hati. Artikel ini tidak merupakan saran investasi pribadi, dan tidak mempertimbangkan tujuan investasi, kondisi keuangan, atau kebutuhan khusus pengguna. Pengguna harus menilai apakah pendapat, pandangan, atau kesimpulan dalam artikel ini sesuai dengan kondisi mereka. Investasi berdasarkan informasi ini sepenuhnya menjadi tanggung jawab pengguna.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan