Percebi algo interessante na estratégia da NVIDIA neste momento. Na semana passada, Jensen Huang explicou em detalhe por que a NVIDIA investiu 20 mil milhões de dólares na aquisição da Groq, e honestamente, é uma decisão estratégica brilhante que mostra como o mercado de inferência está a transformar-se.



Então aqui está o contexto: durante muito tempo, todos se concentravam numa única métrica - a taxa de transmissão. Mas a Groq compreendeu algo que os outros não perceberam. Os engenheiros de software estão agora dispostos a pagar mais por respostas mais rápidas. É uma segmentação de mercado completamente nova. Como Huang disse, se pudermos oferecer tokens com uma latência ultra-baixa, tornando os desenvolvedores mais produtivos, eles vão pagar por isso. É um mercado que acaba de emergir.

E é aí que a Groq entra em cena. Esta aquisição preenche uma lacuna importante no arsenal de inferência da NVIDIA. Enquanto a NVIDIA domina o segmento de alta taxa de transmissão com as suas soluções tradicionais, a Groq traz algo completamente diferente: uma arquitetura LPU conhecida pela sua latência determinista excepcionalmente baixa. Em março, no GTC, a NVIDIA apresentou o Groq 3 LPU, gravado a 4 nm pela Samsung. Os números são impressionantes - 35 vezes mais inferência por megawatt em modelos de 1 trilhão de parâmetros comparado ao Blackwell NVL72.

É basicamente uma extensão da curva de Pareto do mercado. Em vez de escolher entre alta taxa de transmissão ou baixa latência, a NVIDIA agora cria dois segmentos distintos. A Groq continua a operar como entidade independente, o Jonathan Ross e a sua equipa juntaram-se à NVIDIA. O próprio modelo pode ser tarifado de forma diferente consoante o tempo de resposta - menos taxa de transmissão, mas o preço unitário compensa largamente. É pura genialidade comercial, e mostra como o mercado de IA se torna mais sofisticado. As duas abordagens vão coexistir, e os clientes vão escolher consoante as suas necessidades reais.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar