Hoje, a coisa mais importante é a conferência GTC da NVIDIA, que é praticamente uma versão de IA da "Breve História da Humanidade".

robot
Geração de resumo em curso

A coisa mais importante hoje é a conferência GTC da NVIDIA, que é como uma versão de IA da Breve História da Humanidade.

Jensen Huang ainda não subiu ao palco, mas a quantidade de informações vazadas antecipadamente já daria para escrever um livro.

Wanwan organizou três destaques. Vamos lá, amigos gordinhos, sigam-me.

  1. O custo da potência de computação de IA cai diretamente para 10%.

A geração anterior, Blackwell, já era muito potente, certo? Em breve, será anunciada a produção em massa do novo chip Vera Rubin.

O que torna o Vera Rubin tão potente? Em suma, duas palavras: barato.

Executar o mesmo modelo de IA,

o número de chips é reduzido para um quarto, e o custo de computação de inferência cai 90%.

Cai 90%, meus amigos.

AWS, Microsoft e Google, os três principais provedores de nuvem, já estão na primeira leva.

  1. A Groq, adquirida no ano passado por 20 bilhões de dólares, apresenta seu trabalho hoje.

Anteriormente, Jensen Huang disse em uma conferência de resultados que a Groq seria integrada à arquitetura da NVIDIA como uma extensão, assim como a aquisição da Mellanox completou a capacidade de rede.

A LPU da Groq e a GPU da NVIDIA ficam no mesmo data center; a GPU entende a pergunta e a LPU é responsável por gerar rapidamente a resposta.

Os dois tipos de chips cooperam, reduzindo diretamente a latência em cenários de Agent.

Os Agentes de IA realizam tarefas para as pessoas; uma tarefa pode exigir dezenas de chamadas ao modelo, cada uma consumindo poder de computação de inferência, e o usuário está esperando; se for lento, a experiência desmorona.

A inferência é dividida em duas etapas: primeiro, entender sua pergunta; depois, gerar a resposta palavra por palavra.

A GPU é boa na primeira etapa, mas na segunda, a LPU da Groq é superior em velocidade e estabilidade na geração de texto.

20 bilhões é caro?

Pense que, no futuro, cada empresa executará centenas de Agentes, e cada Agente chamará o modelo milhares de vezes por dia.

  1. A versão da NVIDIA do OpenClaw é lançada, chamada NemoClaw.

É uma plataforma de código aberto que as empresas podem instalar para implantar funcionários de IA que executam processos, processam dados e gerenciam projetos em vez de humanos.

Diz-se que já está em negociações com Salesforce e Adobe.

O interessante é que o NemoClaw não exige que você use chips da NVIDIA.

Pense bem nessa lógica.

Vender chips só ganha dinheiro em uma camada de hardware; definir as regras é que permite ganhar dinheiro em toda a cadeia. Jensen Huang fez bem as contas.

  1. Jensen Huang disse que vai mostrar "um chip que o mundo nunca viu".

Provavelmente é a primeira aparição da arquitetura da próxima geração, Feynman, com produção em massa em 2028, usando o processo mais avançado de 1,6nm da TSMC.

Além disso, há uma informação pouco conhecida que acho interessante.

A NVIDIA lançou processadores para laptops, dois modelos, focados em jogos.

Quem vende placas de vídeo vai roubar o lugar das CPUs.

Wanwan, acho que Jensen Huang se tornará uma grande figura no futuro.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado