Con solo unos cientos de tarjetas se puede soportar el tráfico de visitantes, si esta tecnología de optimización fuera de código abierto, ¿cuánto presupuesto de cómputo podrían ahorrar las pequeñas y medianas fábricas?

Ver original
CoinNetwork
Noticias de CoinWorld, OpenAI ha encontrado recientemente un conjunto de soluciones de optimización que pueden reducir los costos de inferencia del modelo en más de la mitad. Según una persona familiarizada con el asunto, los ingenieros de OpenAI dijeron a algunos colegas a principios de este mes que, gracias a varias técnicas de optimización recién desarrolladas, lograron reducir la cantidad de procesadores gráficos (GPU) de Nvidia necesarios a solo unos cientos, especialmente después de aplicar esta tecnología en escenarios donde los visitantes usan ChatGPT sin cuentas gratuitas o de pago.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado