Google actualiza la tarifa del API Gemini, cobrando por niveles según el uso de razonamiento

Google recientemente actualizó los niveles de facturación de la API de Gemini, y las soluciones de optimización y precios se basan en las necesidades reales de uso de inferencia.
Los nuevos niveles de servicio de inferencia incluyen: estándar(Standard), flexible(Flex), prioritario(Priority), por lotes(Batch) y en caché(Caching).
Entre ellos, el nivel de inferencia flexible aprovecha recursos de cálculo inactivos fuera de las horas pico, ofreciendo un 50% de descuento sobre la tarifa estándar, con un retraso objetivo de 1 a 15 minutos, pero sin garantía de retraso.
El nivel de API por lotes también ofrece un 50% de descuento sobre la tarifa estándar, con un retraso máximo de hasta 24 horas.
El nivel en caché se factura en función de la cantidad de tokens(Token) en caché y la duración del almacenamiento, y se recomienda para escenarios como chatbots con instrucciones complejas, análisis repetido de archivos de video largos y consultas a grandes conjuntos de documentos.
El precio del nivel prioritario es entre un 75% y un 100% más alto que el precio estándar, con retrasos controlados en milisegundos a segundos.
Google recomienda este nivel para escenarios como chatbots de atención al cliente en tiempo real, detección de fraudes en tiempo real y asistentes inteligentes críticos para el negocio.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado