Oportunidades por trás do "computador de agentes inteligentes" anunciado por Jensen Huang: dados não saem do dispositivo, tokens totalmente gratuitos

No início deste mês, Jensen Huang, fundador da Nvidia, lançou o primeiro chip de supercomputador para PC (computador pessoal) do mundo, especialmente criado para agentes de IA (Inteligência Artificial) pessoais — o RTX Spark. Este lançamento é visto como a mudança mais disruptiva na indústria de PCs desde a popularização da interface gráfica do Windows na década de 1990, e Huang chegou a chamá-lo de “a primeira reformulação e reconstrução completa do computador pessoal em 40 anos”.

　　Talvez seja prematuro afirmar que o PC foi completamente revolucionado, mas é previsível que a definição de PC esteja se tornando mais flexível. Uma fonte experiente do setor disse a repórteres que os fabricantes de hardware estão atualmente captando ao máximo as oportunidades de IA, com novos designs surgindo constantemente, e o ecossistema de dispositivos finais apresentando uma vitalidade vibrante.

Mudando a arquitetura do computador há 40 anos

　　O RTX Spark não é uma “solução isolada” da Nvidia, mas o resultado de uma aliança ecológica global de tecnologia de ponta, com o chip sendo projetado pela Nvidia em parceria com a MediaTek, fabricado com tecnologia de 3 nanômetros da TSMC, enquanto a Microsoft participa profundamente na otimização do sistema.

　　Este chip não é um CPU ou GPU tradicional, mas uma unidade de sistema altamente integrada (SoC), cuja arquitetura central segue a filosofia de “fusão heterogênea”, consolidando múltiplos componentes dispersos na placa-mãe do PC em um único chip. Sua inovação tecnológica mais disruptiva é a arquitetura de memória unificada — enquanto os PCs tradicionais usam memória separada para CPU (processador central) e GPU (processador gráfico), com dados sendo transferidos repetidamente entre eles, o RTX Spark permite que a CPU e a GPU compartilhem uma pool de memória de até 128GB, com uma largura de banda interna de até 600GB/segundo, graças à tecnologia de interconexão de segunda geração da Nvidia. Este design elimina completamente o gargalo de transferência de dados, permitindo que a GPU acesse diretamente a grande memória do sistema, o que é fundamental para rodar modelos de IA de grande escala.

　　A Nvidia forneceu métricas de desempenho do RTX Spark em vários cenários principais: execução local de modelos de linguagem com 120 bilhões de parâmetros, suportando 1 milhão de tokens de contexto; execução de jogos AAA em 1440p/100FPS; edição fluida de vídeos 12K 4∶2∶2. Entre elas, a capacidade de rodar localmente um modelo de 120 bilhões de parâmetros é especialmente importante — os usuários podem rodar um grande modelo de linguagem equivalente ao GPT-3.5 em um laptop, sem conexão à internet ou pagamento de custos na nuvem, suportando a leitura de livros inteiros ou centenas de páginas de documentos técnicos.

De “software operacional” a “expressão de necessidades”

　　Huang mencionou na palestra a principal diferença entre computadores de IA e computadores tradicionais: “Nos últimos 40 anos, as pessoas abriam aplicativos, clicavam e digitavam comandos para fazer o trabalho. Com o RTX Spark, os usuários só precisam expressar suas necessidades, o resto fica por conta do PC.”

　　Isso indica uma mudança na filosofia de design do computador, que antes sempre girava em torno do “ser humano”, e agora passa a focar na criação de computadores para agentes de IA. O economista digital Liu Xingliang afirmou que as pessoas precisarão passar de “saber operar” para “saber expressar”, e que a habilidade mais importante para o indivíduo no futuro pode ser fazer perguntas, julgar, criar e decidir.

　　Relembrando a recente onda de instalação e desinstalação do “Lagosta” (OpenClaw), o motivo por trás disso foi a fatura imprevisível de tokens e preocupações com segurança. A implantação local de grandes modelos evita esses dois problemas — modelos com 120 bilhões de parâmetros podem ser executados localmente, sem sair do dispositivo, sem limites de uso e sem custos adicionais.

　　Na verdade, desde 2023, já existem produtos de PC com IA no mercado, mas por que o setor considera este ano como o ano zero do PC de IA? A resposta está na disposição do consumidor em pagar. Nos primeiros modelos de AIPC, a capacidade de processamento era de apenas 10 a 40 TOPS (trilhões de operações por segundo), capazes de rodar modelos com menos de 7 bilhões de parâmetros, com utilidade limitada; posteriormente, a capacidade aumentou para 40 a 60 TOPS, podendo rodar modelos de 13 a 30 bilhões de parâmetros, mas a IA ainda era como um plugin. O RTX Spark, por sua vez, foi projetado desde a arquitetura do chip especificamente para agentes de IA, com uma capacidade de processamento local de 1 PetaFLOP (equivalente a 500 TOPS), suportando modelos de 120 bilhões de parâmetros — para consumidores comuns, usar grandes modelos no PC já oferece uma experiência comparável à da nuvem, além de ser mais seguro e sem custos de tokens, o que aumenta significativamente a intenção de compra.

　　A resposta do mercado foi rápida: no dia do lançamento do RTX Spark, as ações da Nvidia subiram 6,26%, a ARM aumentou 15,73%, enquanto a Intel e a Qualcomm caíram 4,67% e 8,78%, respectivamente.

Fazer grandes modelos “completos” rodarem localmente

　　O lançamento de Huang deixou uma empresa chinesa de chips chamada Houmo Intelligent bastante animada. Antes, eles lutavam para convencer o mercado a aceitar a transferência de grandes modelos para o terminal, e a abordagem do RTX Spark é muito semelhante à do chip M50 deles, ou seja, quem conseguir fazer um grande modelo “completo” rodar no computador terá o poder de definir as regras do jogo no mercado de PCs de IA.

　　A estratégia da Nvidia é integrar CPU e GPU em um único chip, enquanto a Houmo Intelligent M50 é um chip de arquitetura de armazenamento e processamento integrados. Ambos compartilham a inovação de transformar a capacidade de cálculo de IA de uma função secundária para uma capacidade principal do chip.

Lenovo lança o PC de IA P7

　　No mês passado, a Lenovo lançou o PC de IA P7 equipado com o chip M50 da Houmo Intelligent, capaz de rodar com fluidez modelos locais de até 122 bilhões de parâmetros. Niu Xiaolin, vice-presidente de vendas do negócio de PCs da Houmo Intelligent, afirmou que o M50 é um chip eficiente projetado especificamente para inferência de grandes modelos, com apenas 10 watts de consumo de energia, oferecendo até 160 TOPS de alta capacidade de processamento, combinando grande memória e alta largura de banda, atendendo às necessidades de implantação local de baixo consumo e alto desempenho.

　　Recentemente, a empresa de tecnologia de Shanghai, Liaoqu Intelligent, em parceria com a Houmo Intelligent, criou um centro de inteligência pessoal com interação holográfica, capaz de organizar agendas, resumir notas e treinar conversas. Este produto já foi implementado em um asilo no distrito de Huangpu, onde idosos podem interagir com familiares distantes por meio de uma imagem digital holográfica.

O centro de inteligência pessoal com interação holográfica criado pela Liaoqu Intelligent em parceria com a Houmo Intelligent.

　　Uma empresa de armazenamento em rede (NAS) também deseja se tornar a próxima central de controle doméstico. Eles pretendem usar a capacidade de modelos de grande escala integrados ao chip M50 para mobilizar os dados pessoais armazenados no NAS, transformando-o em um centro de dados pessoais mais eficiente.

　　Dados do Instituto de Informação e Comunicações da China mostram que, no primeiro trimestre de 2026, a penetração de PCs de IA no país atingirá 42%, um aumento de 380% em relação ao ano anterior. Podemos esperar pelo lançamento do PC de IA que promete “mudar as regras” nesta temporada de outono, ou aguardar uma variedade de produtos inteligentes que florescerão em breve.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

2 gostos

Recompensa
2
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
ShareYourUSStocksWinNvidia
3.67M Popularidade
#
BitcoinRalliesOver5Percent
499.03M Popularidade
#
IsraelStrikesIranBTCPlunges
56.22K Popularidade
#
WinGoldBarsWithGrowthPoints
1.34M Popularidade
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.81M Popularidade

Fixado

‍#分享美股交易赢英伟达股票

Tópicos em destaque

ShareYourUSStocksWinNvidia

BitcoinRalliesOver5Percent

IsraelStrikesIranBTCPlunges

WinGoldBarsWithGrowthPoints

StrongNonfarmPayrollsRekindleRateHikeFear

Fixado