Hoje, o evento mais importante é a conferência GTC da Nvidia, praticamente uma história da humanidade em versão de IA.

robot
Geração de resumo em curso

Hoje o evento mais importante é a conferência GTC da Nvidia, praticamente uma história da humanidade em versão IA.

Ainda nem subiu ao palco, mas a quantidade de informações vazadas já daria para escrever um livro.

A noite, organizei três principais pontos de destaque, vamos lá, amigos, acompanhem-me.

  1. O custo de computação de IA cai para um décimo

A geração anterior, Blackwell, já era bastante potente, certo? Em breve será anunciado o novo chip Vera Rubin em produção em massa.

Por que Vera Rubin é impressionante? Resumindo, são duas palavras: barato.

Executando o mesmo modelo de IA,
o número de chips é reduzido a um quarto, o custo de inferência cai 90%.
Reduzido em 90%, amigos.
AWS, Microsoft e Google, os três maiores provedores de nuvem, já estão na primeira leva de adoção.

  1. A Groq, comprada por 20 bilhões de dólares no ano passado, entrega o trabalho hoje

Antes, Huang Renxun disse na reunião de resultados que a Groq seria integrada à arquitetura da Nvidia, assim como a aquisição da Mellanox completou as capacidades de rede.

A LPU da Groq, junto com a GPU da Nvidia, em um mesmo data center, a GPU entende o problema, a LPU responde rapidamente.

A divisão de tarefas entre os dois chips, a latência em cenários de agentes, é drasticamente reduzida.

Um AI Agent faz o trabalho por você, uma tarefa pode passar por dezenas de ajustes de modelo, cada rodada consumindo poder de inferência, e o usuário está esperando lá, se ficar mais lento, a experiência desanda.

A inferência ocorre em duas etapas: primeiro entender sua questão, depois gerar a resposta palavra por palavra.

GPU é boa na primeira etapa, mas na velocidade e estabilidade de gerar as palavras, a LPU da Groq é mais forte.

200 bilhões, é caro?

Pense bem: no futuro, cada empresa terá centenas de Agents, cada um ajustando milhares de modelos por dia.

  1. A versão Nvidia do OpenClaw chega, chamada NemoClaw

É uma plataforma open source, empresas podem instalá-la para implantar funcionários IA que substituem humanos em processos, análise de dados, gerenciamento de projetos.
Dizem que já estão conversando com Salesforce e Adobe.

O interessante é que o NemoClaw não exige que você use chips Nvidia.
Reflita sobre essa lógica.
Vender chips só gera lucro na camada de hardware, estabelecer regras permite ganhar na cadeia toda. Huang Renxun sabe bem disso.

  1. Huang Renxun disse que vai mostrar um chip “nunca visto antes no mundo”

Provavelmente a próxima geração, o arquiteto Feynman, fará sua primeira aparição, com produção em 2028, usando a tecnologia mais avançada da TSMC, de 1,6 nm.

Além disso, há uma notícia pouco conhecida que acho bastante interessante.

A Nvidia lançou processadores para notebooks, dois modelos, focados em jogos.
Quem vende placas de vídeo agora quer competir pelo mercado de CPUs também.

Noite, sinto que Huang Renxun está destinado a se tornar uma grande figura no futuro.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar