🔥SemiAnalysis Pengujian nyata: GPT-5.5 kembali ke garis depan, tetapi SWE-bench Pro tertinggal oleh Opus 4.7


Lembaga analisis semikonduktor dan AI SemiAnalysis merilis evaluasi komprehensif asisten pemrograman, mencakup GPT-5.5, Opus 4.7, dan DeepSeek V4. GPT-5.5 didasarkan pada pra-pelatihan baru bernama kode "Spud", merupakan model pemrograman pertama OpenAI yang kembali ke garis depan dalam setengah tahun terakhir, insinyur SemiAnalysis mulai beralih antara Codex dan Claude Code. Pengujian menunjukkan pembagian tugas: Claude mahir dalam perencanaan proyek baru, Codex lebih kuat dalam perbaikan bug yang memerlukan reasoning intensif. Tetapi artikel mengungkapkan, Ope…
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan