GPT-5.6 Uji Coba Rahasia Beredar Luas: ChatGPT Menjadi Sangat Pintar, Pengguna Mengalahkan Fable 5 dalam Pengujian

ChatGPT Pengguna Minggu Ini Melaporkan Kualitas Output Melonjak Signifikan, Waktu Respon Memperpanjang Secara Signifikan, Memicu Spekulasi Gila tentang Pengujian Rahasia OpenAI terhadap Model Generasi Berikutnya GPT-5.6. Dari Pembuatan Game 3D Sekali Klik hingga Simulasi Robot, Beberapa Pengembang Mengunggah Perbandingan Pengujian di Platform X, Mengklaim "5.5 Pro Telah Diam-diam Diganti Menjadi 5.6". Dikatakan bahwa Rilis Resmi Paling Cepat 25 Juni, tetapi OpenAI Hingga Kini Tetap Diam.
(Kronologi Singkat: Wakil Kepala Google Gemini Noam Shazeer Mengundurkan Diri dan Bergabung dengan OpenAI)
(Latar Belakang Tambahan: Versi Baru Mythos dari Anthropic Selesai Dilatih, Sonnet 5 Segera Dirilis Minggu Ini)

Daftar Isi Artikel

Toggle

  • Pengguna Bersama Melaporkan: Respon Lebih Lambat, Kualitas Melonjak
  • Detail Bocoran Muncul: Juice Value Naik, Pembaruan Tanggal Batas Pengetahuan
  • Diamnya OpenAI dan Catatan Rilis "Diam" Sebelumnya
  • Di Balik Keinginan Cepat Rilis Model Baru: Kejaran GLM-5.2, Anthropic Terbatas Ekspor

Minggu Ini, Pengguna ChatGPT Tiba-tiba Menemukan Sesuatu, Sepertinya Kualitas Percakapan Berbeda. Bukan Sekadar Perasaan Pribadi Skala Kecil, Melainkan Laporan Massal dari Pengembang, Kreator, dan Lembaga Evaluasi yang Semuanya Mengarah ke Satu Arah: OpenAI Mungkin Sedang Menguji Model Baru Secara Rahasia.

Pengembang Anshu Chimala Mengunggah Video Perbandingan di Platform X pada hari Kamis, Menunjukkan Perbedaan Kualitas Halaman Login yang Dihasilkan Sekali Klik, dengan Kalimat "Well well well, saya adalah salah satu yang beruntung bisa mencoba GPT-5.6 Pro lebih dulu." Pengembang lain, Dobroslav Radosavljevič, juga memposting di X bahwa model yang digunakannya di Codex "sama sekali berbeda dari 5.5," dan kolom komentar terbagi menjadi dua: yang yakin dan yang ragu.

Pengguna Bersama Melaporkan: Respon Lebih Lambat, Kualitas Melonjak

Ciri paling mencolok adalah waktu. Pengembang Conor Dart melakukan sebuah tes, menggunakan satu prompt untuk menghasilkan sebuah game 3D yang dilengkapi mesin fisika dan kontrol kamera, yang memakan waktu lebih dari satu jam, sementara GPT-5.5 Pro biasanya hanya sekitar 10 menit. Ia menulis, "Tidak sempurna, tapi untuk satu prompt, ini sangat mengesankan."

Orang di komunitas AI, Chetas Lua, juga melaporkan kondisi serupa di platform X: saat menguji robot simulasi, waktu respon membengkak menjadi 20 sampai 40 menit, dan menyebut ritme ini "tidak pernah terlihat sejak GPT-5.5 diluncurkan." Ia bahkan menyatakan secara langsung, "GPT-5.6 Pro terus menekan Fable 5 dari Anthropic dalam pengujian 3D."

Namun, tidak semua pengujian menunjukkan hasil yang seragam. Penguji standar AI, Chris, menggunakan prompt pembangunan kapal luar angkasa yang sama untuk menguji dua model: diduga GPT-5.6 Pro berjalan selama 87 menit, sementara GPT-5.5 Extra High hanya membutuhkan 34 menit 42 detik. Ia menganalisis, "Seperti yang saya katakan sebelumnya, GPT-5.6 adalah peningkatan bertahap dan stabil dari 5.5, bukan pembunuh Fable. Mungkin akan bersaing di beberapa benchmark, tapi secara keseluruhan tidak akan secara jelas melampaui."

Detail Bocoran Muncul: Juice Value Naik, Pembaruan Tanggal Batas Pengetahuan

Seiring diskusi memanas, lebih banyak bocoran mulai beredar. Pembocor Pankaj Kumar merinci beberapa spesifikasi yang berubah: tanggal batas pengetahuan diperpanjang hingga Desember 2025; yang disebut sebagai "Juice Value" untuk pengaturan kekuatan inferensi dikatakan meningkat dari 768 ke 960; kemampuan menghasilkan SVG dan desain 3D di beberapa tugas melampaui Fable 5. Sumber informasi meskipun belum dikonfirmasi oleh OpenAI, namun narasi dari berbagai akun sangat konsisten: kemampuan inferensi yang lebih kuat, antarmuka frontend yang belum selesai, dan kode sandi "Kindle-Alpha" sebagai versi kandidat.

Pemimpin opini di bidang AI, Leo, mengutip pesan anonim dan menulis bahwa GPT-5.6 "saat ini sedang diuji secara tertutup di beberapa akun Pro, ketika pengguna memilih GPT-5.5 Pro, yang sebenarnya dijalankan adalah 5.6," dan memprediksi tanggal rilis publik adalah 25 Juni (Kamis).

Diamnya OpenAI dan Catatan Rilis "Diam" Sebelumnya

Ini bukan kali pertama OpenAI mengambil pendekatan "rilis tanpa pengumuman". Mengulas proses peluncuran GPT-4.5, OpenAI juga memilih mengganti model secara langsung tanpa pengumuman, sampai pengguna menyadari perbedaannya dan baru mengonfirmasi secara diam-diam. Strategi rilis stealth ini, di satu sisi, memungkinkan perusahaan mengumpulkan data penggunaan nyata tanpa menarik perhatian berlebihan, dan di sisi lain, memudahkan rollback secara diam-diam jika terjadi masalah, menghindari krisis PR.

Berbeda dengan Anthropic yang merayakan setiap peluncuran model baru secara besar-besaran, Fable 5 dan Mythos 5 dari OpenAI dari selesai pelatihan hingga rilis resmi memiliki garis waktu yang jelas. Dalam beberapa iterasi terakhir, OpenAI semakin cenderung "kerja dulu, baru diumumkan." Jakub Pachocki, kepala ilmuwan, dilaporkan mengatakan dalam rapat internal bahwa model baru adalah peningkatan bermakna dari GPT-5.5, tetapi laporan dari The Information hanya berhenti di situ, tanpa konfirmasi tentang A/B testing atau jadwal rilis.

Perlu dicatat bahwa Decrypt mengajukan pertanyaan ke OpenAI tentang hal ini, tetapi hingga waktu penulisan belum mendapatkan respons.

Di Balik Keinginan Cepat Rilis Model Baru: Kejaran GLM-5.2, Anthropic Terbatas Ekspor

Jika OpenAI benar-benar mempercepat peluncuran model flagship generasi berikutnya, ada tekanan kompetitif yang besar. Model open-source China, GLM-5.2, hanya tertinggal satu poin dari Claude Opus 4.8 di benchmark FrontierSWE, dan sudah secara langsung melampaui GPT-5.5. Indikator ini, yang mengukur performa AI Agent dalam tugas kompleks selama berjam-jam, menjadi standar baru dalam menilai kemampuan nyata model.

Sementara itu, pihak Anthropic menghadapi masalah internal. Model flagship mereka, Mythos 5 dan Fable 5, ditarik dari pasar karena perintah ekspor yang dikeluarkan oleh pemerintah AS pada 12 Juni, terkait sebuah kerentanan jailbreak yang kontroversial. Ini tidak hanya menciptakan kekosongan pasar untuk model-model top, tetapi juga memberi OpenAI sebuah peluang berharga. Jika mereka bisa meluncurkan GPT-5.6 sebelum Anthropic menyelesaikan masalah ekspor ini, mereka berpotensi mengisi kekosongan pasar tersebut.

Sementara itu, laporan dari Wall Street Journal menyebutkan bahwa OpenAI sedang menilai rencana penurunan harga untuk pengembang dan perusahaan, sebagai persiapan IPO ganda yang akan datang. Kompetisi yang semakin ketat dan perang harga pun makin dekat, dan waktu peluncuran model baru menjadi sangat penting bagi narasi pasar modal OpenAI.

Apapun spekulasi komunitas yang gila-gilaan, satu-satunya yang bisa membuktikan keberadaan GPT-5.6 adalah OpenAI sendiri. Tetapi, trader pasar prediksi Polymarket jelas tidak ingin menunggu, dan hingga akhir pekan, harga kontrak rilis GPT-5.6 dari 22 sampai 28 Juni melonjak hingga 89%.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan