31 de maio, a Nvidia na GTC 2026 apresentou o chip super RTX Spark, levando esse número a 1 petaflop, ou seja, 1000 TOPS. Não um aumento de 30% ou 50%, mas ultrapassando uma ordem de grandeza.

No mesmo evento, foram divulgadas outras notícias: a Microsoft, em parceria com a RTX Spark, atualizou o mecanismo de segurança nativo do Windows e introduziu o sandbox de código aberto OpenShell na plataforma Windows; a Adobe anunciou uma reconstrução do Photoshop e Premiere do zero, especialmente para adaptar a arquitetura de memória unificada do RTX Spark; os primeiros seis fabricantes de OEM confirmaram o lançamento neste outono de notebooks leves e desktops compactos equipados com esse chip.

O que a Nvidia fez nesta GTC não foi lançar um novo chip. Ela tenta estabelecer um novo padrão de hardware para a categoria de “computador pessoal com IA”.

Quando o GPU se torna protagonista do PC

Primeiro, olhemos para o próprio chip. Segundo os dados divulgados pela Nvidia na GTC, o RTX Spark integra uma GPU com arquitetura Blackwell, 6144 núcleos CUDA, combinada com uma CPU Grace de 20 núcleos Arm, desenvolvida em parceria com a MediaTek, usando o processo TSMC de 3nm. A mudança mais importante está na arquitetura de memória: até 128GB de memória unificada, onde CPU e GPU compartilham o mesmo pool de memória, eliminando a necessidade de transferir dados entre eles.

Isso contrasta com a lógica tradicional de arquitetura de PC.

A estrutura básica de um PC tradicional é “CPU x86 como processador principal, GPU dedicada como opcional”. Mesmo o conceito de AI PC, emergente nos últimos anos, segue essa lógica: Intel e AMD embutem uma NPU na CPU como módulo adicional de aceleração de IA, com potência de cálculo geralmente na faixa de 40 a 50 TOPS. A GPU ainda é um “componente externo”.

O RTX Spark reverte essa distribuição de poder. Este SoC coloca a GPU como protagonista, enquanto a CPU fica em segundo plano. A Nvidia fornece uma capacidade de IA de 1 petaflop FP4, equivalente a 1000 TOPS, mais de 20 vezes a capacidade de NPU embutida na geração anterior de AI PCs. Não é uma melhoria na mesma pista de corrida, é o início de uma nova corrida.

A velocidade de adoção por parte dos fabricantes de OEM confirma essa avaliação. Segundo anúncios oficiais da Nvidia e reportagens da DIGITIMES, Asus, Dell, HP, Lenovo, Surface da Microsoft e MSI lançarão neste outono notebooks leves e desktops compactos com RTX Spark, com modelos da Acer e GIGABYTE vindo logo depois. Quase todas as principais marcas de Windows PC estão entrando na jogada.

O RTX Spark não nasceu do zero. Em início de 2025, um chip com núcleo Blackwell + Grace foi apresentado como Project DIGITS e DGX Spark, voltado inicialmente para supercomputação Linux para desenvolvedores, com tamanho próximo ao de um pequeno desktop. Um ano depois, essa arquitetura foi compactada para caber em notebooks leves, com troca do sistema operacional de Linux para Windows, e o público-alvo ampliado de desenvolvedores de IA para consumidores comuns e empresas. Essa é a mudança mais notável na apresentação de consumo da GTC 2026: a Nvidia não está lançando um brinquedo para desenvolvedores, mas abrindo as portas do mercado de consumo.

120B de modelos rodando localmente, é suficiente?

A capacidade de processamento e memória responde a uma pergunta fundamental: o que é possível fazer?

Na apresentação, a Nvidia afirmou que o RTX Spark suporta a execução local de grandes modelos de 120 bilhões de parâmetros, com janela de contexto de até um milhão de tokens. Mas o que significa 120B? Como referência, a prática comum com hardware de consumo é rodar modelos de 30 a 40 bilhões de parâmetros com uma RTX 4090 de 24GB, usando quantização para compressão. Modelos menores, de até 9B, podem ser executados rapidamente em placas de consumo. A partir de 9B até 120B, esse salto redefine o que se considera “suficiente” para IA em dispositivos de borda.

Os 128GB de memória unificada são a premissa de tudo isso. Na arquitetura tradicional, CPU tem sua própria memória de sistema, GPU sua própria VRAM, e há uma fronteira física entre elas. Modelos muito grandes, que ultrapassam a capacidade de VRAM, não podem rodar ou exigem divisão complexa e troca de memória, com queda drástica de desempenho. A arquitetura de memória unificada elimina esse gargalo, permitindo que os dados do modelo sejam colocados diretamente no pool compartilhado de 128GB, acessível tanto por CPU quanto por GPU. A Apple Silicon foi pioneira ao demonstrar a viabilidade dessa abordagem para consumo, e agora a Nvidia traz essa tecnologia para o ecossistema Windows.

Além de inferência de grandes modelos, os casos de uso listados pela Nvidia incluem edição de vídeo 12K, renderização de cenas 3D acima de 90GB, jogos com ray tracing a mais de 100 fps em resolução 1440p. Essas aplicações compartilham uma característica: processamento de volumes de dados extremamente grandes, que na arquitetura tradicional demandariam tempos de processamento múltiplos ou simplesmente não seriam possíveis.

“Suportar a execução” e “ser fluido e utilizável” ainda estão distantes. A Nvidia não divulgou a velocidade de inferência real do modelo de 120B no RTX Spark, nem o atraso na primeira token em cenários de janela de contexto de um milhão de tokens. O fator-chave que determina a velocidade de inferência de janelas de contexto longas é a largura de banda de memória. Como referência, o DGX Spark, usando o mesmo núcleo GB10, tem uma largura de banda de cerca de 301GB/s na medição real. Essa largura de banda é suficiente para rodar o modelo de 120B, mas na prática, ao lidar com janelas de contexto de um milhão de tokens, o usuário pode precisar esperar alguns segundos até ver o primeiro token de saída. A versão portátil do RTX Spark pode ter sua largura de banda reduzida por limitações de consumo de energia.

Adicionando uma camada de segurança para agentes de IA

Outro anúncio importante, além do poder de processamento, é a colaboração entre Nvidia e Microsoft na camada de sistema. Essa talvez seja a mudança mais sutil, mas de impacto profundo na indústria, na apresentação de consumo da GTC 2026.

Um computador capaz de rodar um modelo de 120B, se for usado por um agente de IA que possa operar o desktop, clicar, ler e escrever arquivos, apresenta um risco de segurança que vai além de “perder dados”: o risco de o agente fazer algo que você não deseja. Sem uma solução, empresas não podem simplesmente implantar esse tipo de equipamento para seus funcionários.

A Nvidia e a Microsoft propõem duas barreiras. A primeira, a Microsoft atualizou o mecanismo de segurança nativo do Windows, para monitorar e restringir o comportamento do agente de IA a partir do sistema operacional. A segunda, a Nvidia integrou oficialmente o OpenShell, um runtime sandbox de código aberto, ao Windows. Segundo a documentação oficial, o OpenShell fornece isolamento de kernel, delimitando um espaço controlado para o agente de IA, que pode executar tarefas dentro desse limite, mas com permissões restritas, sem acesso a arquivos críticos do sistema, conexão de rede ou dados sensíveis do usuário.

Essa combinação tem um significado claro para compras corporativas. Antes, o conceito de “agente de IA local” permanecia na fase de demonstração técnica. Hardware rodando, mas sem um quadro de segurança. Nenhuma equipe de TI se arriscaria a incluir esse tipo de equipamento na lista de compras. Com a integração de uma camada de isolamento padrão entre hardware e software, a Nvidia e a Microsoft transformam “funcionar” em “gerenciar”.

O desempenho do OpenShell é uma variável a ser observada. Isolamento por sandbox geralmente traz uma perda de desempenho, que pode afetar a velocidade de inferência ou a resposta do sistema. A Nvidia ainda não divulgou dados específicos. A complexidade de implantação na gestão de TI, a compatibilidade com políticas de segurança existentes, são questões que só poderão ser respondidas após o lançamento dos dispositivos OEM.

Por que a Adobe quer “reconstruir do zero”

A cooperação com fabricantes de software costuma ser um indicador importante de se uma nova plataforma de hardware vai se consolidar.

Na GTC, a Adobe anunciou sua maior ação de software nesta rodada de lançamentos. Segundo o blog oficial da Nvidia e confirmações de executivos da Adobe, a empresa iniciou uma reconstrução profunda do Photoshop e Premiere, para adaptar ao novo sistema de memória unificada do RTX Spark, prometendo até 2x de aumento no desempenho de IA e gráficos.

“Reconstrução do zero” não é só colocar um plugin ou fazer uma camada de adaptação. Em PCs tradicionais, CPU e GPU têm suas próprias memórias, e ao lidar com arquivos grandes, como PSDs de 8K ou vídeos em 8K, os dados precisam ser transferidos entre esses dois ambientes, o que gera desperdício de desempenho. A memória unificada do RTX Spark permite que CPU e GPU compartilhem diretamente o mesmo espaço de 128GB, uma mudança estrutural que traz valor real para fluxos de trabalho profissionais. A Adobe mexeu no código de baixo nível, indicando que acredita na direção dessa arquitetura, e não apenas em uma estratégia de marketing pontual.

Porém, qual é a base de comparação para esse “dobro de velocidade”? Nvidia e Adobe não divulgaram. É em relação a um processador x86 com placa de vídeo dedicada? Ou ao NPU do AI PC anterior? Sem esses detalhes, o valor fica no campo das suposições. Antes de divulgar benchmarks, esse número só pode ser considerado uma promessa.

Também anunciaram suporte a Blackmagic Design, ComfyUI, llama.cpp, OTOY e várias empresas de jogos. Destacar o suporte ao ComfyUI e llama.cpp é importante, pois são as ferramentas open source mais ativas na cadeia de trabalho de IA local atualmente. O apoio precoce da comunidade de desenvolvedores costuma refletir de forma mais genuína o potencial de ecossistema de uma plataforma do que as promessas das grandes empresas.

A Nvidia está construindo, com seu ecossistema CUDA e arquitetura de memória unificada, uma experiência semelhante à Apple, de integração de hardware e software. A diferença é que, enquanto a Apple constrói suas próprias muralhas, a Nvidia precisa convencer a Microsoft e os ISVs a construí-las junto. A disposição da Adobe de mexer na base do sistema indica que essa primeira pedra na muralha já foi colocada.

Além dos parâmetros na ficha técnica

Voltando a uma questão mais prática: esses dispositivos realmente vão estar disponíveis? E qual será a experiência de compra?

Segundo informações da Nvidia, os primeiros dispositivos com RTX Spark devem chegar neste outono, com notebooks leves e desktops compactos de Asus, Dell, HP, Lenovo, Surface da Microsoft e MSI. Modelos da Acer e GIGABYTE virão logo depois. Ainda não há detalhes de preços ou datas exatas de lançamento.

Mais importante do que o preço, há várias incógnitas físicas. Como equilibrar consumo e refrigeração ao colocar um chip de 1 petaflop em um notebook leve? Como será o desempenho em tarefas cotidianas, fora de IA, e a duração da bateria? A largura de banda real da memória unificada de 128GB em um notebook será suficiente, ou será limitada por restrições de energia?

Essas questões representam o verdadeiro teste de viabilidade industrial. A potência máxima de um chip em protótipo de engenharia e seu desempenho diário, de 8 horas, nas mãos do consumidor, muitas vezes são coisas diferentes. A Nvidia destacou a eficiência energética do RTX Spark, mas não divulgou valores de TDP ou autonomia.

Do ponto de vista do mercado de PCs, a chegada do RTX Spark sinaliza uma nova divisão de tarefas. Nos últimos trinta anos, o poder de decisão sobre os principais chips do PC esteve nas mãos dos fabricantes de processadores x86. As GPUs, embora cada vez mais importantes, sempre foram componentes “plugados” na placa-mãe. Agora, a Nvidia apresenta um SoC completo, que integra CPU, GPU e controlador de memória, com CPU Arm projetada pela MediaTek. A estrutura de poder na cadeia de produção de PCs está mudando de “x86 CPU + GPU opcional” para “Plataforma SoC centrada na GPU”.

Essa mudança não acontecerá de um dia para o outro. Estratégias de preço dos OEMs, desempenho real de eficiência energética, evolução de software por ISV, ciclos de validação de compras corporativas — cada etapa determinará se o RTX Spark será uma nova referência na indústria ou apenas uma demonstração de tecnologia de alto nível. A resposta só virá no outono.

NVDAX-1,18%

AAPLX2,9%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
ShareYourUSStocksWinNvidia
3.28M Popularidade
#
GatePartnersWithAlpacaToBridgeCryptoAndStocks
65.45K Popularidade
#
IsraelStrikesIranBTCPlunges
52.54K Popularidade
#
BTC触底66000
10.73K Popularidade
#
ZECRalliesAgainstMarket
5.02M Popularidade

Fixado

sitemap

AI PC chegou, hardware local que enfrenta o grande modelo de 120B! Nvidia redefine a base de “computador AI pessoal” com RTX Spark

Quando o GPU se torna protagonista do PC

120B de modelos rodando localmente, é suficiente?

Adicionando uma camada de segurança para agentes de IA

Por que a Adobe quer “reconstruir do zero”

Além dos parâmetros na ficha técnica

Tendências

ShareYourUSStocksWinNvidia

GatePartnersWithAlpacaToBridgeCryptoAndStocks

IsraelStrikesIranBTCPlunges

BTC触底66000

ZECRalliesAgainstMarket

Fixado