Google(GOOGL.US) memperbarui penetapan harga API Gemini berdasarkan penalaran dan penagihan per tingkat penggunaan

robot
Pembuatan abstrak sedang berlangsung

Aplikasi Zhitung Finance APP melaporkan bahwa Google (GOOGL.US) baru-baru ini memperbarui tingkat penagihan untuk Gemini API. Solusi pengoptimalan dan penetapannya disusun berdasarkan kebutuhan penggunaan inferensi yang sebenarnya.

Tingkat layanan inferensi yang ditambahkan kali ini meliputi: standar (Standard), fleksibel (Flex), prioritas (Priority), batch (Batch), dan caching (Caching).

Google menyatakan: “Gemini API menyediakan berbagai mekanisme optimasi yang dapat menyeimbangkan kecepatan eksekusi, biaya penggunaan, dan stabilitas layanan sesuai dengan kebutuhan beban kerja bisnis tertentu. Baik untuk membangun robot percakapan real-time, maupun untuk menjalankan proses pemrosesan data offline berskala besar, memilih mode eksekusi yang tepat dapat secara signifikan menurunkan biaya atau meningkatkan efisiensi operasional.”

Di antaranya, tingkat inferensi fleksibel memanfaatkan sumber daya komputasi yang idle di luar jam puncak, menawarkan diskon lima kali lipat dari harga standar, dengan target latensi 1 hingga 15 menit, namun tidak menyediakan jaminan latensi. Tingkat Batch API juga menawarkan diskon lima kali lipat dari tarif standar, dengan latensi maksimum hingga 24 jam.

Penagihan untuk tingkat caching didasarkan pada jumlah token (Token) yang dicache dan durasi penyimpanan. Disarankan untuk chatbot yang memuat instruksi sistem kompleks, analisis berulang file video berdurasi panjang, serta kueri kumpulan dokumen skala besar, dan skenario serupa.

Harga untuk tingkat prioritas lebih tinggi 75% hingga 100% dibandingkan harga standar, dan latensi dapat dikendalikan pada level milidetik hingga detik. Google menyarankan tingkat ini digunakan untuk skenario seperti chatbot layanan pelanggan real-time, deteksi penipuan real-time, serta asisten cerdas yang bersifat krusial bagi bisnis.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan