Hoje, o evento mais importante é a conferência GTC da Nvidia, praticamente uma história da humanidade em versão IA.

robot
Geração de resumo em curso

Hoje, a coisa mais importante é a conferência GTC da NVIDIA. É praticamente uma História do Homem de IA.

Ainda nem o Huang Renxun subiu ao palco, e o volume de informações vazadas com antecedência já daria para escrever um livro.

A Xiaowxian organizou três destaques à noite. Vamos lá, amigos gordos, venham comigo.

1)Os custos de computação de IA caem diretamente para um décimo

A geração anterior da Blackwell já era bastante poderosa, certo? Em breve, vão anunciar a produção em massa da próxima geração de chips, a Vera Rubin.

Em que a Vera Rubin é forte? Em poucas palavras: é barata.

Executando o mesmo modelo de IA, a quantidade de chips é reduzida para um quarto, e o custo do cálculo de inferência diminui em 90%. Diminuir 90%, amigos. A AWS, a Microsoft e a Google, as três maiores empresas de cloud, já estão a entrar na primeira leva.

2)O Groq, que custou 20 mil milhões de dólares no ano passado, entrega trabalho hoje

Antes, o Huang Renxun disse numa reunião de resultados que o Groq seria integrado ao ecossistema da NVIDIA como uma arquitetura de extensão, tal como na altura em que compraram a Mellanox para complementar capacidades de rede.

O LPU do Groq fica no mesmo data center que as GPUs da NVIDIA. A GPU entende o problema; o LPU encarrega-se de cuspi-lo rapidamente em forma de resposta.

Com a divisão de trabalho entre dois tipos de chips, a latência nos cenários de Agent cai diretamente.

Um AI Agent faz o trabalho por humanos; uma tarefa pode ajustar o modelo dezenas de vezes, e em cada ronda está-se a queimar capacidade de inferência, além de o utilizador estar ali a esperar. Mais lento e a experiência desaba.

A inferência é feita em duas etapas: primeiro, compreender a tua pergunta; depois, escrever a resposta letra por letra. A GPU é boa na primeira etapa, mas na segunda etapa, a velocidade e a estabilidade de “escrever” as palavras são melhores com o LPU da Groq.

Os 20 mil milhões de dólares são caros? Pensa nisto: no futuro, cada empresa vai correr centenas de Agents, e cada Agent vai ajustar modelos milhares de vezes por dia.

3)Lança-se o OpenClaw da NVIDIA, chamado NemoClaw

É um conjunto de plataforma open source: as empresas instalam e conseguem implementar “funcionários de IA” para executar processos como humanos, processar dados e gerir projetos. Dizem que já estão a negociar com a Salesforce e a Adobe.

O mais interessante é que o NemoClaw não te exige que uses os chips da NVIDIA. Analisa bem esta lógica. Vender chips dá dinheiro apenas na camada de hardware; definir regras é o que faz dinheiro em toda a cadeia. O Huang Renxun faz as contas muito bem.

4)O Huang Renxun diz que vai mostrar “um chip que o mundo nunca viu”

Muito provavelmente, é a primeira aparição da arquitetura de próxima próxima geração, a Feynman, produzida em 2028, com o processo de 1,6 nm mais avançado da TSMC.

Além disso, há um pedaço de informação pouco falado que acho bastante interessante.

A NVIDIA vai lançar processadores para computadores portáteis, e são dois modelos, focados em jogos. As empresas que vendem placas gráficas vão vir disputar o lugar das CPUs.

Sinto que a Xiaowxian, no futuro, o Huang Renxun vai tornar-se um grande homem de uma era.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar