Então aqui está o contexto: durante muito tempo, todos se concentravam numa única métrica - a taxa de transmissão. Mas a Groq compreendeu algo que os outros não perceberam. Os engenheiros de software estão agora dispostos a pagar mais por respostas mais rápidas. É uma segmentação de mercado completamente nova. Como Huang disse, se pudermos oferecer tokens com uma latência ultra-baixa, tornando os desenvolvedores mais produtivos, eles vão pagar por isso. É um mercado que acaba de emergir.

E é aí que a Groq entra em cena. Esta aquisição preenche uma lacuna importante no arsenal de inferência da NVIDIA. Enquanto a NVIDIA domina o segmento de alta taxa de transmissão com as suas soluções tradicionais, a Groq traz algo completamente diferente: uma arquitetura LPU conhecida pela sua latência determinista excepcionalmente baixa. Em março, no GTC, a NVIDIA apresentou o Groq 3 LPU, gravado a 4 nm pela Samsung. Os números são impressionantes - 35 vezes mais inferência por megawatt em modelos de 1 trilhão de parâmetros comparado ao Blackwell NVL72.

É basicamente uma extensão da curva de Pareto do mercado. Em vez de escolher entre alta taxa de transmissão ou baixa latência, a NVIDIA agora cria dois segmentos distintos. A Groq continua a operar como entidade independente, o Jonathan Ross e a sua equipa juntaram-se à NVIDIA. O próprio modelo pode ser tarifado de forma diferente consoante o tempo de resposta - menos taxa de transmissão, mas o preço unitário compensa largamente. É pura genialidade comercial, e mostra como o mercado de IA se torna mais sofisticado. As duas abordagens vão coexistir, e os clientes vão escolher consoante as suas necessidades reais.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
Gate13thAnniversaryLive
1.28M Popularidade
#
WCTCTradingChallengeShare8MUSDT
832.08K Popularidade
#
IsraelStrikesIranBTCPlunges
30.82K Popularidade
#
CryptoMarketSeesVolatility
202.29K Popularidade
#
rsETHAttackUpdate
77K Popularidade

Fixar

Tópicos em destaque

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

IsraelStrikesIranBTCPlunges

CryptoMarketSeesVolatility

rsETHAttackUpdate

Fixar