Esta ola de caché implícito de Alibaba reduce directamente el costo en un ochenta por ciento, la pesadilla de gastar mucho dinero en el agente de contexto largo finalmente tiene solución.

Ver original
CoinNetwork
Noticia de Coinjie.com, el equipo de Qwen de Alibaba ha anunciado que en la plataforma Alibaba Cloud Bailian, el modelo insignia Qwen3.7-max tendrá activado automáticamente el caché implícito por defecto. Los desarrolladores no necesitan modificar el código ni especificar parámetros adicionales para disfrutar directamente de la reducción de costos mediante caché. Bajo un mecanismo de facturación completamente nuevo, el sistema identificará y extraerá automáticamente los prefijos de contexto repetidos en las solicitudes. Una vez que se produce un acierto en la caché, el costo de los tokens de entrada en la parte acertada solo se cobrará al 20% del precio original, eliminando directamente el 80% del costo de entrada. La caché implícita se dirige directamente a los enormes gastos en escenarios de textos largos y agentes inteligentes. Qwen3.7-max, con una ventana de contexto de 1 millón de tokens, al ejecutar tareas avanzadas como codificación autónoma, requiere leer con alta frecuencia y repetidamente grandes bibliotecas de código o documentos de conocimiento.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado