Nos últimos dois anos, os fabricantes de PCs repetidamente mencionaram um parâmetro ao promoverem "PCs com IA": a potência do NPU. Mas, quer seja os 45 TOPS do Lunar Lake da Intel, quer os 50 TOPS do Strix Point da AMD, esses números permanecem numa escala relativamente moderada. Podem fazer desfoque de fundo, reduzir ruído de voz, rodar alguns modelos de pequena escala na ponta, mas nada mais.

No dia 31 de maio, a Nvidia apresentou na GTC 2026 o chip super RTX Spark, que elevou esse número para 1 petaflop, ou seja, 1000 TOPS. Não um aumento de 30% ou 50%, mas ultrapassando diretamente uma ordem de grandeza.

Também foram anunciadas outras notícias no mesmo evento: a Microsoft, em parceria com o RTX Spark, atualizou o mecanismo de segurança nativo do Windows, e integrou o sandbox de código aberto OpenShell na plataforma Windows; a Adobe anunciou uma reconstrução profunda do Photoshop e do Premiere, adaptando-os à arquitetura de memória unificada do RTX Spark; os primeiros seis fabricantes de OEM confirmaram o lançamento, neste outono, de laptops leves e desktops compactos equipados com esse chip.

O que a Nvidia fez nesta GTC não foi apenas lançar um novo chip. Ela tenta estabelecer um novo padrão de hardware para a categoria de "computador pessoal com IA".

Quando o GPU se torna protagonista do PC

Primeiro, olhemos para o próprio chip. Segundo os dados divulgados pela Nvidia na GTC, o RTX Spark integra uma GPU baseada na arquitetura Blackwell, com 6144 núcleos CUDA, combinada com uma CPU Grace de 20 núcleos Arm, desenvolvida em parceria com a MediaTek, usando o processo TSMC de 3nm. A mudança mais importante está na arquitetura de memória: até 128GB de memória unificada, onde CPU e GPU compartilham o mesmo pool de memória, eliminando a necessidade de transferir dados entre eles.

Isto contrasta com a lógica tradicional de arquitetura de PCs.

A estrutura básica de um PC convencional é "CPU x86 como processador principal, GPU independente como componente opcional". Mesmo o conceito de IA PC, emergente nos últimos anos, segue essa lógica, com Intel e AMD incluindo um NPU embutido na CPU para acelerar IA, com potência geralmente na faixa de quarenta a cinquenta TOPS. A GPU ainda é uma "componente externo".

O RTX Spark reverte essa distribuição de poder. Este SoC coloca a GPU no papel principal, enquanto a CPU fica em segundo plano. A Nvidia fornece uma potência de IA de 1 petaflop FP4, equivalente a 1000 TOPS, mais de 20 vezes a potência de NPU embutida na geração anterior de PCs com IA. Isso não é apenas uma melhoria na mesma pista, é o início de uma nova corrida.

A velocidade de adoção por parte dos fabricantes de OEM confirma essa avaliação. Segundo anúncios oficiais da Nvidia e reportagens da DIGITIMES, Asus, Dell, HP, Lenovo, Surface da Microsoft e MSI lançarão neste outono laptops leves e desktops compactos com RTX Spark, com modelos da Acer e GIGABYTE a seguir. Quase todas as principais marcas de PCs com Windows estão entrando na jogada.

O RTX Spark não nasceu do zero. No início de 2025, um chip com núcleo Blackwell e Grace foi apresentado sob os nomes Project DIGITS e DGX Spark, inicialmente voltado para supercomputadores Linux para desenvolvedores, com tamanho próximo ao de um pequeno desktop. Um ano depois, essa arquitetura foi compactada para caber em laptops leves, com o sistema operacional trocado de Linux para Windows, e o público-alvo expandido de desenvolvedores de IA para consumidores comuns e empresas. Essa é a mudança mais notável na apresentação de consumo na GTC 2026: a Nvidia não está lançando um brinquedo para desenvolvedores, mas abrindo as portas do mercado de consumo.

Modelos de 120B rodando localmente, são suficientes?

A potência e a memória precisam responder a uma pergunta fundamental: o que é possível fazer com elas?

Na apresentação, a Nvidia afirmou que o RTX Spark suporta a execução local de grandes modelos de 120 bilhões de parâmetros, com janela de contexto de até um milhão de tokens. Mas o que significa 120B? Como referência, a prática comum com hardware de consumo é rodar modelos de 30 a 40 bilhões de parâmetros com uma RTX 4090 de 24GB, usando quantização para compressão. Modelos menores, de até 9B, podem ser executados rapidamente em placas de consumo. A diferença de 9B para 120B redefine o que se considera "suficiente" na ponta do dispositivo para IA.

A memória unificada de 128GB é a base de tudo isso. Em arquiteturas tradicionais, CPU e GPU têm suas próprias memórias físicas, com limites claros. Modelos maiores que a capacidade de memória simplesmente não rodam, ou exigem complexas divisões e troca de dados, com queda de desempenho. A arquitetura de memória unificada elimina esse gargalo, permitindo que os dados do modelo sejam colocados diretamente no pool compartilhado de 128GB, acessível tanto pela CPU quanto pela GPU. A Apple Silicon foi pioneira ao demonstrar a viabilidade dessa abordagem para consumo, e agora a Nvidia a traz para o ecossistema Windows.

Além de inferência de grandes modelos, os casos de uso listados pela Nvidia incluem edição de vídeo 12K, renderização de cenas 3D acima de 90GB, e jogos com ray tracing a mais de 100 fps em resolução 1440p. Todos esses cenários envolvem processamento de volumes de dados extremamente grandes, que na arquitetura tradicional demandariam tempos de espera múltiplos ou simplesmente não seriam possíveis.

Entre "suportar execução" e "ser fluido e utilizável", há uma distância. A Nvidia não divulgou a velocidade de inferência de um modelo de 120B no RTX Spark, nem o tempo de latência para o primeiro token em janelas de contexto de um milhão de tokens. O fator determinante para a velocidade de inferência com janelas longas é a largura de banda de memória. Como referência, o DGX Spark, usando núcleos GB10, atinge cerca de 301GB/s de largura de banda de memória. Essa largura de banda é suficiente para rodar um modelo de 120B, mas na prática, ao lidar com janelas de contexto de um milhão de tokens, o usuário pode precisar esperar alguns segundos até ver o primeiro token de saída. A versão portátil do RTX Spark pode ter sua largura de banda reduzida por limitações de consumo de energia.

Adicionando uma camada de segurança para agentes de IA

Outro anúncio central, além da potência de cálculo, é a colaboração entre Nvidia e Microsoft na camada de sistema. Essa parte pode ser a mais facilmente ignorada na GTC 2026, mas terá impacto profundo na indústria.

Um computador capaz de rodar um modelo de 120B, se for usado por um agente de IA que possa operar o desktop, clicar, ler e escrever arquivos, apresenta um risco de segurança que vai além de "perder dados". A questão passa a ser: o agente pode fazer algo que você não deseja? Sem uma solução, empresas não podem implantar esse tipo de equipamento para seus funcionários.

A solução da Microsoft e Nvidia envolve duas barreiras. A primeira, a Microsoft atualizou o mecanismo de segurança nativo do Windows, para monitorar e restringir o comportamento do agente de IA a nível do sistema operacional. A segunda, a Nvidia integrou oficialmente o OpenShell, um runtime sandbox de código aberto, na plataforma Windows. Segundo a documentação oficial, o OpenShell fornece isolamento de núcleo, delimitando um espaço controlado para o agente de IA atuar, que pode executar tarefas dentro de limites estritos, sem acesso irrestrito a arquivos do sistema, rede ou dados sensíveis do usuário.

Essa combinação tem um significado claro para compras empresariais. Antes, o conceito de "agente de IA local" permanecia na fase de demonstração técnica. Hardware rodava, mas o sistema de segurança era inexistente. Sem uma estrutura de segurança, as empresas não se arriscariam a adquirir esses dispositivos. A Nvidia e a Microsoft criaram uma camada de isolamento padronizada entre hardware e software, transformando "funcionar" em "gerenciar".

O impacto do OpenShell no desempenho ainda é uma variável a ser observada. Isolamento por sandbox geralmente implica perdas de desempenho, mas o quanto isso afetará a velocidade de inferência ou a resposta do sistema ainda não foi divulgado. A complexidade de implantação na gestão de TI corporativa, e a compatibilidade com políticas de segurança existentes, são questões que só poderão ser respondidas após o lançamento de dispositivos OEM.

Por que a Adobe quer "reconstruir do zero"

A cooperação dos fabricantes de software costuma ser um indicador importante de se um novo hardware vai se consolidar.

Na GTC, a Adobe anunciou uma das ações mais relevantes do lado do software. Segundo o blog oficial da Nvidia e confirmações de executivos da Adobe, a empresa iniciou uma reconstrução profunda do Photoshop e do Premiere, adaptando-os à arquitetura de memória unificada do RTX Spark, prometendo até 2x de aumento no desempenho de IA e gráficos.

"Reconstrução do zero" não significa apenas adicionar plugins ou camadas de adaptação. Em PCs tradicionais, CPU e GPU têm suas próprias memórias, e ao lidar com arquivos PSD gigantes ou vídeos 8K, os dados precisam ser transferidos entre esses dois ambientes, causando desperdício de desempenho. A memória unificada do RTX Spark permite que CPU e GPU compartilhem diretamente o mesmo espaço de 128GB, uma mudança estrutural que traz benefícios reais para fluxos de trabalho profissionais. A decisão da Adobe de mexer na base do código indica que ela acredita que essa arquitetura não é uma estratégia de marketing passageira.

Porém, o que exatamente significa "dobrar o velocidade" em relação ao benchmark, Nvidia e Adobe não divulgaram. É uma comparação com processadores x86 de última geração com placas dedicadas, ou com a geração anterior de PCs com NPU? Sem dados de referência, esse número deve ser visto com ceticismo.

Também foram anunciados suporte por Blackmagic Design, ComfyUI, llama.cpp, OTOY e várias empresas de jogos. Destaca-se a atenção à comunidade de código aberto, com ferramentas como ComfyUI e llama.cpp, que representam fluxos de trabalho de IA local mais ativos atualmente. O suporte inicial da comunidade de desenvolvedores costuma refletir mais a potencialidade do ecossistema do que promessas de grandes fabricantes.

A Nvidia está tentando criar uma experiência semelhante à Apple, usando o ecossistema CUDA e arquitetura de memória unificada no Windows. A diferença é que, enquanto a Apple constrói suas próprias muralhas, a Nvidia precisa convencer a Microsoft e os desenvolvedores independentes a construí-las junto. O fato de a Adobe estar disposta a mexer na base do sistema indica que a primeira pedra dessa muralha já foi colocada.

Além dos parâmetros na folha de especificações

Voltando a uma questão prática: esses dispositivos realmente estarão disponíveis para compra? E qual será a experiência ao adquiri-los?

Segundo informações da Nvidia, os primeiros dispositivos com RTX Spark chegarão neste outono, de fabricantes como Asus, Dell, HP, Lenovo, Surface da Microsoft e MSI. Modelos da Acer e GIGABYTE virão posteriormente. Ainda não há detalhes de preços ou datas exatas de lançamento.

Mais importante do que o preço, há várias incógnitas físicas. Como equilibrar consumo de energia e refrigeração ao colocar um chip de 1 petaflop em um laptop leve? Como será o desempenho cotidiano e a autonomia da bateria na ausência de tarefas de IA? A largura de banda da memória unificada de 128GB será suficiente em um formato de notebook, ou será limitada por restrições de consumo?

Essas questões representam o verdadeiro teste de viabilidade industrial. A potência máxima de um chip em protótipo de engenharia muitas vezes difere bastante do desempenho real no uso diário. A Nvidia destacou a eficiência energética do RTX Spark, mas não divulgou valores de TDP ou autonomia de bateria.

Do ponto de vista do mercado de PCs, a chegada do RTX Spark sinaliza uma nova divisão de tarefas. Nos últimos trinta anos, o poder de decisão sobre os principais chips do PC esteve nas mãos dos fabricantes de processadores x86. Os GPUs, embora cada vez mais importantes, sempre foram considerados componentes adicionais. Agora, a Nvidia apresenta um SoC completo, que integra CPU, GPU e controlador de memória, com CPU Arm da MediaTek. A estrutura de poder na indústria de PCs está mudando de "x86 + GPU opcional" para "SoC centrado na GPU".

Essa mudança não acontecerá de um dia para o outro. Estratégias de preço dos OEMs, desempenho real, compatibilidade de software, ciclos de validação de clientes corporativos — cada etapa determinará se o RTX Spark será uma nova referência na indústria ou apenas uma demonstração de tecnologia com alta expectativa inicial. A resposta só virá no outono.

NVDAX-0,59%

AAPLX3,09%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
ShareYourUSStocksWinNvidia
24M Popularidade
#
WinGoldBarsWithGrowthPoints
1.29M Popularidade
#
IsraelStrikesIranBTCPlunges
52.46K Popularidade
#
BTC触底66000
10.27K Popularidade
#
ZECRalliesAgainstMarket
5.02M Popularidade

Fixado

O PC de IA chegou, com hardware local para um grande modelo de 120B! A Nvidia redefine a base do "computador pessoal de IA" com o RTX Spark

Quando o GPU se torna protagonista do PC

Modelos de 120B rodando localmente, são suficientes?

Adicionando uma camada de segurança para agentes de IA

Por que a Adobe quer "reconstruir do zero"

Além dos parâmetros na folha de especificações

Tópicos em destaque

ShareYourUSStocksWinNvidia

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

BTC触底66000

ZECRalliesAgainstMarket

Fixado