Menghabiskan beberapa hari untuk menguji OpenAI Codex


Bahkan dengan GPT-5.4 xhigh (tingkat inferensi tertinggi) diaktifkan, saat digunakan sebagai model utama masih sering melakukan kesalahan.
Misalnya, satu kali salah paham instruksi dan langsung menghapus hal yang seharusnya tidak dihapus. Contoh lain lebih parah: dia merasa sudah berhasil menulis, padahal sebenarnya sama sekali tidak.
Hal yang sama terjadi tiga kali berturut-turut, setiap kali baru diketahui setelah Opus melakukan review di belakang.
Kesimpulan saya saat ini adalah Codex sangat cocok sebagai alat bantu, jika diberikan tugas kode yang jelas dia akan melakukannya dengan cepat dan baik.
Tapi untuk memahami instruksi kompleks berulang langkah dan memutuskan apakah harus bertindak atau tidak? Masih kurang.
Saat ini saya tetap mengandalkan Opus sebagai kekuatan utama 😎
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan