O evento mais importante de hoje é a conferência GTC da Nvidia, praticamente uma história resumida da humanidade, mas versão IA.

robot
Geração de resumo em curso

Hoje, o evento mais importante é a conferência GTC da NVIDIA, praticamente uma história da humanidade na era da IA.

Ainda nem subiu ao palco, mas as informações antecipadas já dão para escrever um livro.

A noite, organizei os três principais destaques. Vamos lá, amigos, acompanhem-me.

  1. Custo de computação de IA reduzido a um décimo

A geração anterior, Blackwell, já era poderosa, certo? Em breve, será anunciado o novo chip Vera Rubin em produção em massa.

Por que Vera Rubin é tão impressionante? Resumindo, são duas palavras: barato.

Executando o mesmo modelo de IA, o número de chips foi reduzido a um quarto, e o custo de inferência caiu 90%. Reduziu 90%, amigos. AWS, Microsoft e Google, os três maiores provedores de nuvem, já estão na primeira fase de adoção.

  1. Groq, comprado por 20 bilhões de dólares no ano passado, entrega hoje seu produto

Antes, Jensen Huang disse na apresentação de resultados que a Groq seria integrada à arquitetura da NVIDIA, assim como a aquisição da Mellanox completou a capacidade de rede.

A LPU da Groq, junto com a GPU da NVIDIA, no mesmo data center, a GPU entende o problema, a LPU fornece respostas rápidas.

A divisão de tarefas entre os dois chips, em cenários de agentes, reduz a latência drasticamente.

Um AI Agent faz o trabalho por você, uma tarefa pode passar por dezenas de ajustes de modelo, cada rodada consumindo poder de inferência, e o usuário espera lá, uma experiência lenta pode falhar.

A inferência ocorre em duas etapas: primeiro entender sua questão, depois gerar a resposta palavra por palavra.

GPU é boa na primeira etapa, mas na velocidade e estabilidade de gerar as palavras, a LPU da Groq é superior.

200 bilhões, é caro?

Pense bem: no futuro, cada empresa terá centenas de agentes, cada um ajustando milhares de modelos por dia.

  1. Lançamento do OpenClaw da NVIDIA, chamado NemoClaw

É uma plataforma open source, que permite às empresas implantar funcionários de IA para substituir humanos em processos, manipular dados, gerenciar projetos. Dizem que já estão conversando com Salesforce e Adobe.

O mais interessante é que o NemoClaw não exige o uso de chips NVIDIA. Reflitam sobre essa lógica. Vender chips só gera lucro na camada de hardware; estabelecer regras permite ganhar na cadeia toda. Jensen Huang sabe bem disso.

  1. Jensen Huang disse que vai mostrar um chip “nunca visto antes”

Provavelmente, a próxima geração, Feynman, fará sua primeira aparição, com produção em massa em 2028, usando a tecnologia mais avançada da TSMC, de 1,6 nm.

Além disso, há uma notícia pouco conhecida que acho bastante interessante.

A NVIDIA lançou processadores para notebooks, dois modelos, voltados para jogos. Quem vende placas de vídeo agora vai competir pelo mercado de CPUs.

Na noite, sinto que Jensen Huang está destinado a se tornar uma grande figura.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar