$GOOG y $MRVL están trabajando en un chip de inferencia de baja latencia separado


Según SemiAnalysis, Google está desarrollando una familia de TPU separada centrada en inferencia de baja latencia, con el nombre en clave Merope. En otras palabras, esto parece ser una arquitectura similar a LPU diseñada para cargas de trabajo de inferencia más rápidas en lugar de la hoja de ruta principal de TPU de la compañía
Los informes también indican que Marvell está involucrada en el desarrollo de este diseño. La línea de tiempo prevista es 2028, y es independiente de los programas principales de TPU que se están desarrollando con Broadcom y MediaTek
Ver originales
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado