Baru saja Google melempar bom lagi - 19 Februari mereka merilis Gemini 3.1 Pro, dan ini bukan sekadar pembaruan kosmetik. Jujur, bahkan saya sendiri terkejut saat melihat mereka melewatkan versi 3.0 dan langsung melompat ke 3.1. Biasanya Google mengikuti skema 1.0 - 1.5 - 2.0 - 2.5 - 3.0, tapi kali ini ada sesuatu yang berbeda.



Fitur utama - ini bukan peningkatan kemampuan, melainkan peningkatan nyata pada kecerdasan model. Mereka mengintegrasikan teknologi pemikiran mendalam langsung ke dalam inti, sehingga sekarang model dapat memikirkan suatu tugas dari berbagai sudut secara bersamaan dan memilih opsi terbaik. Sebelumnya ini adalah fitur berbayar untuk pelanggan berlangganan, sekarang menjadi standar.

Apa yang benar-benar saya sukai saat pengujian? Model memahami kesalahan logika yang tidak jelas dalam kode, yang banyak programmer mungkin akan lewatkan. Menulis query SQL optimal dengan indeks yang tepat, menjelaskan paradoks Monty Hall sedemikian rupa sehingga bahkan orang non-teknis bisa mengerti. Ini bukan sekadar menyajikan fakta - ini adalah proses berfikir yang nyata.

Dari segi benchmark, angka-angkanya mengesankan:
- ARC-AGI-2 (tes logika): 77.1% dibandingkan 31.1% versi sebelumnya. Ini lebih dari dua setengah kali lipat.
- Humanity's Last Exam: 44.4% - lebih tinggi dari GPT-5.2 (34.5%)

Tapi bukan cuma angka. Demo yang mereka unggah benar-benar keren. Model memahami suasana novel "Wuthering Heights" dan menghasilkan situs portofolio yang benar-benar menyampaikan suasana gelap buku tersebut. Membuat simulasi 3D interaktif kawanan burung, di mana kita bisa mempengaruhi jalur terbangnya dengan tangan. Terhubung ke API ISS dan membangun dashboard aerospasial nyata. Ini bukan sekadar kode yang dihasilkan - ini adalah pemahaman konteks dan kreativitas.

Multimodalitas tetap di level flagship: teks, gambar, video, audio, PDF. Jendela konteks tetap sama, sekitar satu juta token (seperti mengunggah seluruh "Perang dan Damai"), tetapi output maksimal meningkat menjadi 64-65 ribu token. Ini seperti satu buku kecil dalam satu permintaan.

Tapi di mana komunitas menemukan kelemahan - itu di tugas kantor. Dalam tes GDPval-AA (presentasi, tabel, dokumen) Gemini mendapatkan skor 1317, sedangkan Claude Sonnet 4.6 mendapatkan 1633. Dalam peringkat di mana orang memilih jawaban yang mereka sukai, Claude masih di atas. Jadi untuk kode kompleks - Gemini unggul, untuk presentasi menarik - Claude lebih baik.

Sekarang yang paling menarik - harganya. Google tidak menaikkannya. Masuk dengan satu juta token hanya 2 dolar (jika konteks sampai 200K) atau 4 dolar (jika lebih). Outputnya 12 atau 18 dolar. Sebagai perbandingan: Claude Sonnet 4.6 meminta 3 dolar untuk masuk dan 15 dolar untuk keluar, GPT-5.2 itu 10 dan 30, dan Claude Opus 4.6 - 15 dan 75.

Secara praktis: jika Anda perlu memproses 100K token input dan 10K output:
- Gemini: 32 sen
- Claude Sonnet: 45 sen
- GPT-5.2: 1,30 dolar
- Claude Opus: 2,25 dolar

Gemini jadi 7 kali lebih murah dari Opus. Untuk beban produksi, perbedaan ini sangat terasa.

Artificial Analysis melakukan pengujian: mereka menjalankan semua model top melalui indeks kecerdasan mereka. Gemini membutuhkan 56 juta token dan biayanya $892. GPT-5.2 menghabiskan 130 juta (2304 dolar), Claude Opus - 58 juta (2486 dolar). Artinya, volume kecerdasan yang sama di Gemini jauh lebih murah, sekitar 2,6 kali lipat.

Untuk pengguna biasa, tersedia langganan. Google AI Plus seharga 8 dolar per bulan - ini mode Pro Gemini 3.1 Pro, Deep Research, 1000 gambar per hari. Cukup untuk kebanyakan orang. Google AI Pro seharga 20 dolar - 100 permintaan per hari dan 20 Deep Research. Google AI Ultra seharga 250 dolar - semua fitur di atas plus Deep Think dan prioritas tertinggi.

Kenapa Google tidak menaikkan harga? Beberapa alasan. Pertama, mereka mengutamakan aksesibilitas - AI Studio gratis, token gratis melimpah, API murah. Kedua, kompetisi. Anthropic merilis Claude Sonnet 4.6 - rasio harga dan kualitas yang bagus. OpenAI tidak tidur. Untuk mempertahankan pengembang, harga harus kompetitif. Ketiga, model ini masih dalam preview, jadi Google bisa melakukan demping dan mengumpulkan feedback. Saat dirilis resmi, harga bisa berubah.

Secara keseluruhan? Ini pembaruan yang sangat baik. Logika benar-benar meningkat, harga tidak naik, kualitas kode berkembang pesat. Tidak sempurna, tapi sangat menarik. Terutama jika Anda pengembang yang hemat dan mampu membaca spesifikasi.

Tentu ada nuansa. Jika Anda membutuhkan kode sistem yang kompleks - GPT-5.3-Codex mungkin lebih baik. Jika Anda membuat presentasi untuk dewan direksi - Claude Sonnet 4.6 lebih rapi. Jika bekerja dengan data rahasia - model ini tidak cocok, karena semuanya berjalan di server AS.

Tapi yang benar-benar penting: model yang dirilis hari ini, besok bisa usang. Saat saya menulis ini, di laboratorium Google, OpenAI, dan Anthropic, kemungkinan besar sudah melatih sesuatu yang baru. Jadi saran saya: ambil Gemini 3.1 Pro, coba untuk tugas nyata Anda. Jika cocok - nikmati dan hemat uang. Jika tidak - masih banyak pilihan lain. Banyak model bagus saat ini, dan ini berita terbaik.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan