Entonces, aquí está el contexto: durante mucho tiempo, todos se centraban en una sola métrica - el rendimiento. Pero Groq entendió algo que los demás pasaron por alto. Los ingenieros de software ahora están dispuestos a pagar más por respuestas más rápidas. Es una segmentación del mercado completamente nueva. Como dijo Huang, si podemos ofrecer tokens con una latencia ultra baja, haciendo a los desarrolladores más productivos, ellos pagarán por eso. Es un mercado que acaba de emerger.

Y aquí es donde entra Groq. Esta adquisición llena una brecha importante en el arsenal de inferencia de NVIDIA. Mientras NVIDIA domina el segmento de alto rendimiento con sus soluciones tradicionales, Groq aporta algo completamente diferente: una arquitectura LPU conocida por su latencia determinista excepcionalmente baja. En marzo, en el GTC, NVIDIA presentó el Groq 3 LPU, grabado en 4 nm por Samsung. Las cifras son impresionantes: 35 veces más inferencia por megavatio en modelos de 1 billón de parámetros en comparación con Blackwell NVL72.

Es básicamente una extensión de la curva de Pareto del mercado. En lugar de elegir entre alto rendimiento o baja latencia, NVIDIA ahora crea dos segmentos distintos. Groq continúa operando como una entidad independiente, Jonathan Ross y su equipo se unieron a NVIDIA. El mismo modelo puede ser tarifado de manera diferente según el tiempo de respuesta: menos rendimiento, pero el precio unitario compensa ampliamente. Es pura genialidad comercial, y muestra cómo el mercado de la IA se vuelve más sofisticado. Ambos enfoques coexistirán, y los clientes elegirán según sus necesidades reales.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
Gate13thAnniversaryLive
1.28M Popularidad
#
WCTCTradingChallengeShare8MUSDT
832.08K Popularidad
#
IsraelStrikesIranBTCPlunges
30.82K Popularidad
#
CryptoMarketSeesVolatility
202.29K Popularidad
#
rsETHAttackUpdate
77K Popularidad

Anclado

Temas de actualidad

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

IsraelStrikesIranBTCPlunges

CryptoMarketSeesVolatility

rsETHAttackUpdate

Anclado