NVIDIA, AWS Lançam Infraestrutura de IA para Escala de Produção

Terrill Dicki

24 de jun de 2026 00:18

NVIDIA e AWS revelam ferramentas de IA para agilizar implantações em escala empresarial, aproveitando novas instâncias EC2 G7 e pesquisa vetorial acelerada por GPU no OpenSearch.

NVIDIA (NASDAQ: NVDA) e Amazon Web Services (AWS) estão aprofundando sua colaboração para tornar a implantação de IA em escala de produção mais acessível às empresas. A parceria apresenta novas ferramentas, incluindo instâncias EC2 G7 alimentadas por GPUs RTX PRO 4500 da NVIDIA e pesquisa vetorial acelerada por GPU no Amazon OpenSearch Serverless. Esses avanços visam reduzir a complexidade operacional enquanto oferecem capacidades de IA de alto desempenho.

As instâncias EC2 G7 representam um avanço significativo. Em comparação com a geração G6 anterior, a G7 oferece até 4,6x de melhoria no desempenho de inferência de IA e processamento gráfico 2,1x mais rápido. Com até oito GPUs por instância, 256GB de memória GPU e rede de 700 Gbps, essas configurações são projetadas para cargas de trabalho exigentes, desde inferência de IA em grande escala até processamento de mídia em alta resolução. Também são fáceis de integrar via ferramentas AWS como SageMaker, EMR e EKS.

No lado da recuperação, a nova biblioteca cuVS da NVIDIA torna a indexação vetorial alimentada por GPU padrão no Amazon OpenSearch Serverless. Essa melhoria oferece até 10x mais desempenho na pesquisa vetorial a um quarto do custo dos sistemas baseados em CPU. Para empresas que desenvolvem aplicações como busca semântica ou motores de recomendação, essas melhorias se traduzem em implantação mais rápida e economia de custos significativa.

NVIDIA Amplia Liderança em IA

Essa parceria com a AWS reforça a evolução da NVIDIA para um provedor de infraestrutura de IA de pilha completa. Em 23 de junho de 2026, a capitalização de mercado da NVIDIA atingiu US$ 4,88 trilhões, refletindo seu domínio em computação acelerada. Marcos recentes, como a comercialização da plataforma Vera Rubin e o anúncio de 35 novos supercomputadores de IA na Europa em 22 de junho, sinalizam as ambições mais amplas da empresa além das GPUs.

Além de hardware, a NVIDIA está avançando na orquestração de software de IA. Seu sistema operacional de inferência Dynamo 1.0, lançado no início deste ano, já está integrado por grandes provedores de nuvem, incluindo a AWS. Isso complementa as novas ofertas da AWS, criando um caminho mais simplificado para as empresas operacionalizarem cargas de trabalho de IA.

Implicações de Mercado

Para a AWS, alcançar o status de Cloud Exemplar da NVIDIA para a plataforma GB300 fortalece sua posição como provedora de primeira linha para cargas de trabalho de treinamento de IA. Essa certificação garante que os clientes se beneficiem de desempenho consistente e otimizado para treinamento de modelos em grande escala, reduzindo a incerteza na escolha do provedor de nuvem.

Para a NVIDIA, esses avanços representam mais um passo na sua transformação de fabricante de GPUs para líder em infraestrutura de IA integrada verticalmente. As parcerias próximas com grandes players como a AWS e a inovação contínua em hardware e software de IA posicionam a empresa como uma peça-chave na indústria de IA.

Investidores podem achar esses desenvolvimentos promissores, especialmente à medida que a NVIDIA continua expandindo sua presença em supercomputação de IA e software. Com suas ações negociadas a US$ 200,04 em 23 de junho de 2026, a capacidade da empresa de manter sua trajetória de crescimento depende da adoção bem-sucedida de suas soluções de infraestrutura de IA por parceiros como a AWS.

Empresas que buscam escalar a produção de IA acharão as últimas ofertas da NVIDIA e AWS atraentes, com a promessa de custos reduzidos, implantação mais rápida e menor overhead operacional. À medida que essas ferramentas se tornarem mais amplamente disponíveis—algumas já ainda este ano—seu impacto no mercado de infraestrutura de IA será importante de acompanhar.

Fonte da imagem: Shutterstock

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários