He notado algo interesante en la estrategia de NVIDIA en este momento. La semana pasada, Jensen Huang explicó en detalle por qué NVIDIA invirtió 20 mil millones de dólares para adquirir Groq, y sinceramente, es una decisión estratégica brillante que muestra cómo el mercado de la inferencia está en proceso de transformación.



Entonces, aquí está el contexto: durante mucho tiempo, todos se centraban en una sola métrica - el rendimiento. Pero Groq entendió algo que los demás pasaron por alto. Los ingenieros de software ahora están dispuestos a pagar más por respuestas más rápidas. Es una segmentación del mercado completamente nueva. Como dijo Huang, si podemos ofrecer tokens con una latencia ultra baja, haciendo a los desarrolladores más productivos, ellos pagarán por eso. Es un mercado que acaba de emerger.

Y aquí es donde entra Groq. Esta adquisición llena una brecha importante en el arsenal de inferencia de NVIDIA. Mientras NVIDIA domina el segmento de alto rendimiento con sus soluciones tradicionales, Groq aporta algo completamente diferente: una arquitectura LPU conocida por su latencia determinista excepcionalmente baja. En marzo, en el GTC, NVIDIA presentó el Groq 3 LPU, grabado en 4 nm por Samsung. Las cifras son impresionantes: 35 veces más inferencia por megavatio en modelos de 1 billón de parámetros en comparación con Blackwell NVL72.

Es básicamente una extensión de la curva de Pareto del mercado. En lugar de elegir entre alto rendimiento o baja latencia, NVIDIA ahora crea dos segmentos distintos. Groq continúa operando como una entidad independiente, Jonathan Ross y su equipo se unieron a NVIDIA. El mismo modelo puede ser tarifado de manera diferente según el tiempo de respuesta: menos rendimiento, pero el precio unitario compensa ampliamente. Es pura genialidad comercial, y muestra cómo el mercado de la IA se vuelve más sofisticado. Ambos enfoques coexistirán, y los clientes elegirán según sus necesidades reales.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado