Biaya penalaran hanya seperatus dua puluh dari GPT-5.5, model Gemini 3.2 real-time muncul di Google Cloud

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan Beating, daftar filter model di Google Cloud Console menampilkan opsi model dasar bernama gemini-3.2-flash-lite-live-preview.
Ini adalah kali kedua model seri ini muncul di platform resmi setelah jejaknya terungkap pada paket pembangunan aplikasi iOS dan AI Studio awal bulan ini.
Opsi baru ini dilengkapi dengan akhiran lite dan live, menunjukkan bahwa Google sedang memisahkan versi khusus untuk interaksi waktu nyata dengan latensi sangat rendah.
CEO Abacus.AI Bindu Reddy sebelumnya mengungkapkan bahwa kemampuan pengkodean dan inferensi Gemini 3.2 Flash mencapai 92% dari GPT-5.5, tetapi berkat teknologi distilasi dan sparsifikasi, biaya inferensinya hanya sepertiga dari yang terakhir, dengan sebagian besar query memiliki latensi di bawah 200 milidetik.
Seiring dengan peluncuran antarmuka cloud secara lebih awal, industri memperkirakan bahwa model ringan dengan efisiensi biaya ekstrem ini akan resmi dirilis pada Google I/O pada 20 Mei.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan