Evaluasi Pihak Ketiga Dirilis: Model Baru Thinking Machines Terhubung dengan GPT-Realtime-2, Menduduki Peringkat Teratas Audio

Menurut pemantauan oleh Dongcha Beating, platform data Scale Labs telah mengumumkan peringkat Audio MC S2S terbaru. Hasil evaluasi menunjukkan bahwa model TML-Interaction-Small yang baru dirilis oleh Thinking Machines mencapai skor APR sebesar 43,4%, menyamai posisi pertama dengan GPT-Realtime-2 (xHigh) dari OpenAI. Dalam hal skor spesifik, GPT-Realtime-2 (xHigh) memegang skor tertinggi dengan 48,45 poin, diikuti dengan dekat oleh TML-Interaction-Small dengan 43,36 poin. Karena perbedaan skor berada dalam margin kesalahan statistik, kedua model secara resmi dinilai seri untuk posisi pertama. Tingkat kedua diduduki oleh versi standar GPT-Realtime-2 (37,61 poin), Gemini 3.1 Flash Live yang diaktifkan mode berpikir (36,06 poin), dan GPT-Realtime-1.5 yang lebih lama. Scale Labs mencatat bahwa model ini menunjukkan kemampuan kesadaran konteks panjang yang langka di antara model full-duplex yang ada sambil mempertahankan kecepatan respons yang cepat dalam percakapan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan