Traducción al español:

Según Wu Shuo, el CEO de Coinbase, Brian Armstrong, declaró que la empresa ha reducido casi a la mitad sus gastos en IA empresarial mediante la optimización de su infraestructura, mientras que el uso de tokens de IA sigue creciendo exponencialmente. Las medidas clave de reducción de costos incluyen: establecer modelos de código abierto como GLM 5.2 y Kimi 2.7 como opción predeterminada para la puerta de enlace interna de LLM, emparejar tareas con los modelos más rentables mediante enrutamiento inteligente, y aumentar la tasa de aciertos de caché de herramientas como LibreChat del 5% al 60%. Armstrong enfatizó que el objetivo de gestionar los costos de IA no es limitar su uso, sino hacer que el crecimiento exponencial sea sostenible reduciendo el desperdicio.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

6 me gusta

Recompensa
6
7
2
Compartir

Comentar

Añadir un comentario

MechanicalHummingbird

· hace8h

GLM 5.2 como predeterminado, esta ola de modelos nacionales que salen al extranjero ha sido verificada, ¿verdad?

Ver originalResponder0

ElevatorMeme

· hace15h

Crecimiento exponencial + reducción de costos a la mitad, el equipo de infraestructura de IA de Coinbase podría vender cursos.

Ver originalResponder0

GateUser-2bbf8435

· hace15h

Brian tiene una idea peculiar, no es reducir el presupuesto sino reducir el desperdicio, el uso de IA se duplica y el costo se reduce, eso es verdadera reducción de costos y aumento de eficiencia.

Ver originalResponder0

GateUser-ffe7bee5

· hace15h

Del 5% al 60%, esta optimización de caché parece que ha dominado la ingeniería de prompts.

Ver originalResponder0

GateUser-870b5e71

· hace15h

¿Hay alguna solución de código abierto para el caché de LibreChat? Quiero copiar el trabajo.

Ver originalResponder0

FragmentedSilverStarMap

· hace15h

60% de tasa de aciertos de caché subió desde 5%, esta mejora me da envidia, nosotros internamente todavía estamos luchando en 20%.

Ver originalResponder0

SunshineCollector

· hace15h

Modelos de código abierto + enrutamiento inteligente, esta estrategia es realmente dura. GLM y Kimi se establecen directamente como predeterminados, y el dinero ahorrado se puede usar para más rondas de entrenamiento.

Ver originalResponder0

Temas de actualidad
Ver más
#
SKHynixTopsKOSPIByMarketCap
1,61M Popularidad
#
MicronEarningsBeatExpectationsSharesRise
470,64K Popularidad
#
IsraelStrikesIranBTCPlunges
64,42K Popularidad
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
343,91K Popularidad
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
185,48K Popularidad

Fijado

Temas de actualidad

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fijado