Um artigo para compreender a palestra de ComputeX do Velho Huang: não é um lançamento de produto, é uma "mobilização para a Revolução Industrial da IA".

Desde a infraestrutura de IA, plataformas de chips, IA empresarial, até Bots e gêmeos digitais... O velho Huang pintou uma nova era de Fabrica de IA (AI Factory) que está a emergir.

Escrito por: Zhang Yaqi

Fonte: Wall Street Journal

No dia 19 de maio de 2025, Jensen Huang, fundador e CEO da Nvidia, fez um discurso principal de duas horas na Computex 2025.

Desde a infraestrutura de IA, plataformas de chip, IA empresarial, até Bots e gêmeos digitais... o velho Huang descreveu uma nova era de fábrica de IA (AI Factory) que está surgindo.

No passado, os centros de dados serviam aplicações tradicionais; mas hoje, os centros de dados de IA não são apenas "centros de dados", mas sim fábricas de IA (AI Factory): uma nova fábrica inteligente que tem eletricidade como entrada e "Token" como saída.

"A NVIDIA não é mais apenas uma empresa de tecnologia, agora somos uma empresa de infraestrutura de IA."

Ele enfatizou que esta é uma terceira revolução da infraestrutura após a eletricidade e a internet - infraestrutura inteligente.

Lançamento de chip de peso: Grace Blackwell GB200 e arquitetura NVLink

Jensen Huang apresentou o NVLink Spine — um módulo de interconexão central com 70 libras, dois milhas de cabos e 130 TB/s de largura de banda. Ele afirmou: "A taxa de transferência de dados deste sistema é maior do que a de toda a Internet!"

O GB200 Grace Blackwell super chip utiliza um encapsulamento de dupla núcleo e conecta 72 GPUs, parecendo mais um "chip gigante virtual". Foi construído sobre a mais recente arquitetura NVLink Spine, onde um único nó é equivalente ao desempenho do supercomputador Sierra de 2018.

Jensen Huang afirmou:

"Isto não é um servidor, isto é uma fábrica de IA. Você insere energia e ela te dará Token."

Além disso, a conferência de lançamento também trouxe a atualização do sistema GB200. A Nvidia planeja lançar o GB300 no Q3, que melhora o desempenho de inferência em 1,5 vezes, a memória HBM em 1,5 vezes, a largura de banda da rede em 2 vezes, e mantém a compatibilidade física com a geração anterior, alcançando 100% de refrigeração líquida.

NVLink Fusion: ecossistema de interconexão de chips aberto

O mais atraente é, sem dúvida, o plano NVLink Fusion.

A arquitetura NVLink Fusion permite a conexão perfeita de CPUs / ASICs / TPUs de outros fabricantes com GPUs da NVIDIA. Esta tecnologia oferece NVLink Chiplet & IP de interface, permitindo a combinação livre de "infraestrutura semi-personalizada".

De forma simples, os clientes podem escolher usar a sua CPU juntamente com os chips de IA da NVIDIA, ou usar a CPU da NVIDIA com aceleradores de IA de outros fornecedores.

Há análises que consideram que o NVLink, como uma das tecnologias-chave da NVIDIA para garantir a sua posição dominante em cargas de trabalho de IA, resolve o problema da velocidade de comunicação entre GPUs e CPUs em servidores de IA, que é um dos maiores obstáculos à escalabilidade, afetando diretamente o desempenho máximo e a eficiência energética. Em comparação com a interface PCIe padrão, oferece maior largura de banda e menor latência, com uma vantagem de largura de banda de até 14 vezes.

A fusão NVLink permite que a Fujitsu e a Qualcomm utilizem essa interface para suas próprias CPUs, com a funcionalidade NVLink integrada no chipset ao lado do pacote de computação. A NVIDIA também atraiu aceleradores de silício personalizados de designers como MediaTek, Marvell e Alchip, suportando outros tipos de aceleradores de IA personalizados para trabalhar em conjunto com a CPU Grace da NVIDIA.

Jensen Huang disse humorosamente:

"Claro, você usa tudo da Nvidia, isso me deixaria mais feliz. Mas se você usar apenas um pouquinho das coisas da Nvidia, eu também ficaria muito contente."

Era do Supercomputador Pessoal: DGX Spark e DGX Station

Huang Renxun afirmou que o computador pessoal de IA Project DIGITS, o DGX Spark, mencionado anteriormente na CES, já entrou em produção total e será lançado nas próximas semanas.

DGX Spark é direcionado a pesquisadores de IA que desejam ter seu próprio supercomputador, e cada empresa definirá seu próprio preço. Jensen Huang afirmou: "Todo mundo pode ter um no Natal."

"Hoje, cada pessoa pode ter o seu próprio supercomputador de IA e... pode ligá-lo na tomada da cozinha."

Reestruturação de AI Empresarial: Do Hardware ao Agentic AI

Jensen Huang também anunciou o servidor AI RTX Pro para empresas: suporta cargas de trabalho de TI tradicionais x86, Hypervisor, Windows, entre outros. Ao mesmo tempo, pode executar agentes AI gráficos (AI Agents), e até mesmo o jogo Crysis pode ser executado.

Jensen Huang afirmou que a Agentic AI é o "colaborador digital" do futuro. Atendentes digitais, gerentes de mercado digitais, engenheiros digitais, entre outros, farão parte da força de trabalho das empresas. A Nvidia irá implementar suporte completo de AI Ops e colaborar com CrowdStrike, Red Hat, DataRobot e outros para impulsionar a implementação de AI nas empresas.

"Vamos precisar de um novo RH para gerir estes funcionários AI."

Nova arquitetura de armazenamento AI: NVIDIA AIQ + Nemo + front-end de armazenamento GPU

Jensen Huang afirmou que a IA não lê apenas SQL, ela precisa entender a semântica dos dados não estruturados, e os sistemas de armazenamento do futuro terão GPUs integradas para busca, ordenação, inserção e indexação.

A Nvidia também irá implementar o Nemo + NeMo Retriever + IQ, um "framework de pesquisa semântica em IA" de código aberto, e colaborará com a Dell, Hitachi, IBM, NetApp e VAST para implementar uma plataforma empresarial.

Bots vão se tornar a próxima "indústria de um trilhão de dólares"

Jensen Huang afirmou que está avançando em paralelo com a indústria automóvel no desenvolvimento de sistemas de Bots, utilizando a plataforma Isaac Groot, que é alimentada por um novo processador chamado Jetson Thor, projetado especificamente para aplicações de Bots, adequado para tudo, desde veículos autónomos a sistemas homem-máquina. O sistema operacional Isaac da NVIDIA gerencia todo o processamento de redes neurais, processamento de sensores e pipelines de dados, utilizando modelos pré-treinados desenvolvidos por uma equipe especializada em Bots para aprimorar as capacidades do sistema.

"Na era da IA, para treinar Bots... você primeiro deve usar IA para ensinar IA."

Jensen Huang também afirmou que está a aplicar o seu modelo de IA em automóveis autónomos, lançando uma frota global em parceria com a Mercedes, utilizando a tecnologia de condução autónoma end-to-end da Nvidia, que poderá ser realizada ainda este ano.

Ele acredita que os Bots se tornarão a próxima indústria avaliada em trilhões de dólares, mas isso requer muito esforço. O departamento de Bots da NVIDIA tem a capacidade de fazer isso, e isso se deve apenas à escalabilidade.

Lançamento do motor AI físico Newton

Jensen Huang afirmou que já colaborou com a DeepMind e a Disney Research para desenvolver o motor físico mais avançado do mundo, Newton, que está previsto para ser open source em julho.

Segundo a introdução, o Newton suporta totalmente a aceleração por GPU, possui alta diferenciabilidade e capacidade de operação em tempo real ultra-rápida, sendo capaz de realizar um aprendizado eficaz através da experiência. A NVIDIA está integrando este motor físico no simulador ISAAC da NVIDIA, essa integração nos permite "dar vida" a esses Bots de uma forma real.

Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)