Gemini 3.1 Flash-Lite resmi dirilis: harga input hanya seperempat dari Claude 4.5 Haiku, GPQA lebih tinggi hampir 14 poin persentase

Menurut pemantauan Beating, Google Gemini 3.1 Flash-Lite telah beralih dari pratinjau bulan Maret ke versi resmi (GA), ini adalah model termurah dan tercepat dalam seri Gemini 3, siap digunakan dalam lingkungan produksi dengan tingkat lalu lintas tinggi. Model ini dilengkapi dengan empat tingkat pengendalian kekuatan inferensi thinking (minimal, rendah, sedang, tinggi), pengguna dapat menyesuaikan antara kecepatan dan kualitas sesuai skenario.

Harga tetap pada tingkat pratinjau: input 0,25 dolar AS per juta token, output 1,50 dolar AS per juta token. Dibandingkan dengan pesaing sekelas, harga input adalah seperempat dari Claude 4.5 Haiku (0,25 vs 1,00 dolar), harga output kurang dari sepertiga (1,50 vs 5,00 dolar); juga lebih murah dari generasi sebelumnya 2.5 Flash, input turun dari 0,30 menjadi 0,25, output dari 2,50 menjadi 1,50. Jendela konteks 1 juta token.

Performa melampaui level: GPQA Diamond (inferensi ilmiah tingkat pascasarjana) 86,9%, mengalahkan Claude 4.5 Haiku yang 73,0% dan GPT-5 mini yang 82,3%; MMMU-Pro (pemahaman dan inferensi multimodal) 76,8%, juga unggul dari pesaing sekelas. Kecepatan output 363 token/detik, 45% lebih cepat dari 2.5 Flash, respons token pertama 2,5 kali lebih cepat. Skor Elo di papan peringkat Arena.ai adalah 1432.

Beberapa perusahaan sudah menggunakannya dalam lingkungan produksi. Platform layanan pelanggan Gladly menggunakan Flash-Lite untuk menggerakkan agen AI saluran teks, menangani jutaan interaksi pelanggan setiap minggu, biaya sekitar 60% lebih rendah dibanding model tingkat pemikiran yang setara, latensi p95 sekitar 1,8 detik, tingkat keberhasilan 99,6%. JetBrains menggunakannya untuk menggerakkan asisten AI IDE dan agen Junie. Platform operasi keuangan Ramp menggunakannya untuk skenario sensitif latensi tinggi dan frekuensi tinggi.

Pemrograman adalah kelemahan relatif Flash-Lite, LiveCodeBench 72,0% tertinggal dari GPT-5 mini yang 80,4%.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan