黄仁勋:precisa de mais Tokens e engenheiros, este é o corte de fita da revolução AI

robot
Geração de resumo em curso

Notícias do Feixiang.com (Sun Yingxin) — continua a mesma pele preta, a mesma postura imponente, a mesma figura energética e tagarela do velho Huang.

No dia 17 de março, na conferência GTC 2026, que se abriu em São Jose, Califórnia, nos EUA, o fundador e CEO da NVIDIA, Huang Renxun, começou o aguardado discurso temático. Os espectadores que vieram para assistir à palestra precisavam de fila; a sala estava cheia de gente. Este discurso não foi apenas uma revisão, por Huang Renxun, dos 20 anos de acumulação tecnológica — houve também uma proclamação fervorosa do seu plano para o desenvolvimento futuro da IA, como se quisesse colocar a coroa da era dos Token na cabeça de alguém.

“Bem-vindos à GTC. Quero apenas lembrar-vos que isto é uma conferência técnica… Vamos falar de tecnologia; vamos falar de plataformas.” A seguir, Huang Renxun, sem parar, fez durante duas horas e anunciou que a era da inferência em IA já chegou plenamente. O velho Huang apontou que a inteligência artificial passou do simples estágio de treino para uma nova era de inferência e ação. Nesta fase, a IA já não se limita a compreender o mundo — começa a pensar, a planear e a executar tarefas.

Motores de biliões de biliões: a fábrica de Token e a revolução do custo de computação

Sempre que há grandes acontecimentos, veste-se de pele. Nesta edição da conferência, o velho Huang apresentou, com grande impacto, uma explicação aprofundada do conceito de computação de nível biliões e da fábrica de Token. Ele previu, sem hesitar, que a procura global de computação de IA em 2027 atingirá pelo menos 1 bilião de dólares — um valor muito acima das previsões anteriores de 500 mil milhões de dólares, marcando a entrada oficial do setor numa fase de crescimento na ordem das milhões de vezes. Combinando com as previsões anteriores do velho Huang sobre a computação ser equivalente à Lei de Moore, é possível acreditar que este número da procura global de computação de IA é apenas o começo.

O velho Huang avançou um ponto de vista revolucionário: os centros de dados estão a transformar-se de instalações tradicionais de armazenamento em bases de produção de Token. “Token tornou-se o novo bem de grande consumo; o desempenho da inferência determina as receitas.” Ele acredita que, neste novo paradigma, a produção dos centros de dados já não será apenas dados estáticos, mas Token gerados de forma dinâmica. A quantidade de Token que cada unidade de energia elétrica consegue gerar determina diretamente a capacidade de receitas das empresas.

Para ilustrar esta ideia, o velho Huang também deu um exemplo seu, revelando a impressionante eficácia da nova plataforma Rubin. Esta plataforma aumenta em dez vezes o melhor nível de desempenho em camadas do valor por Token; e, além disso, acompanha-se uma grande evolução de eficiência: numa escala de um centro de dados de 1GW, a taxa de geração de Token alcançará um crescimento de 350 vezes no espaço de dois anos.

A partir daqui, o velho Huang aproveitou para fazer publicidade de passagem e destacou a importância da eficiência de arquitetura. “Se a arquitetura estiver errada, mesmo que seja gratuita, continua a não compensar.” Ele explicou ainda que, embora a construção de um centro de dados de nível de gigawatt exija cerca de 40 mil milhões de dólares, só a escolha da arquitetura ideal (de quem é a arquitetura? Tu percebes) é que garante que este investimento avultado se converta num custo de produção de Token com a máxima competitividade.

O velho Huang diz isto com convicção, afinal, na altura, foi ele próprio que embalou e enviou o primeiro DGX-1, no valor de 300 mil dólares, para o então desconhecido escritório da OpenAI, oferecendo-o à equipa do Ilya Sutskever; mais tarde, aquela máquina tornou-se o berço da computação do conjunto GPT.

E agora, nove anos depois, com o mesmo custo de computação de 1 PFLOPS, esse valor desceu de dezenas de centenas de mil dólares para apenas alguns milhares de dólares, e o volume passou do tamanho de um servidor para o de um livro. Até o próprio velho Huang comenta, admirado: “A velocidade da queda do custo de computação é algo que nenhuma tecnologia ao longo da história da humanidade consegue comparar.”

Tempestade de agentes: ascensão do OpenClaw e um novo paradigma no local de trabalho

Antes, tínhamos falado do anúncio fervoroso do velho Huang, como se quisesse colocar a coroa da era dos Token na cabeça de alguém. Agora, este cenário torna-se ainda mais concreto. Perante o tema quente da atualidade — IA — ele não poupou elogios ao OpenClaw, lançando declarações revolucionárias sobre o setor, incluindo vários argumentos impactantes acerca de agentes inteligentes de IA.

O velho Huang tem muita confiança no OpenClaw, chamando-o de “o sistema operativo para o cálculo em agentes”, e ainda afirmou: “O OpenClaw, em poucas semanas, ultrapassou o feito de 30 anos do Linux.” Ele indicou que o OpenClaw não é apenas um projeto open source; é também o eixo central que liga grandes modelos, ferramentas, sistemas de ficheiros e capacidades de escalonamento. Ele permite que cada agente inteligente de IA tenha, como se fosse um computador pessoal a executar o Windows, capacidades independentes de gestão de recursos e execução de tarefas.

Em seguida, o velho Huang falou de SaaS. Com a popularização do OpenClaw, ele apresentou uma ousada “tese do fim do SaaS”: “Todos os SaaS tornar-se-ão AaaS (agente como serviço).” E disse que, no futuro, as empresas de software já não vão apenas fornecer ferramentas para as pessoas usarem; vão fornecer agentes inteligentes capazes de executar tarefas de forma autónoma. As empresas têm de definir a sua própria estratégia de OpenClaw, tal como era crucial definir a estratégia de Linux ou de HTTP naquela altura.

Se isto fosse tudo, seria subestimar a capacidade do velho Huang de acertar em pontos que magoam. A seguir, ele lançou uma perspetiva ainda mais avançada, sobre a transformação do sistema de remuneração dos engenheiros, descrevendo o cenário futuro do mercado de trabalho assim: “Os engenheiros vão receber salário anual + orçamento de Token; Token torna-se o recurso central da eficiência.” Ou seja, no futuro a receita dos engenheiros passará a ser composta por duas partes: salário base e orçamento de Token. Engenheiros capazes de usar eficientemente o orçamento de Token terão a sua produtividade ampliada dez vezes. O orçamento de Token já até se tornou uma nova ferramenta de recrutamento no Vale do Silício: “Quantos Token vão acompanhar a minha tarefa?” tornar-se-á na pergunta mais importante para quem procura emprego.

Ele diz isto também com experiência pessoal. O velho Huang mencionou um episódio curioso que aconteceu: um Huang Renxun falso gerado por IA, durante uma transmissão em direto da GTC, falava sobre criptomoeda falsa, e o número de pessoas que o viram chegou a 100 mil — cinco vezes o número de espectadores da transmissão oficial. Depois, ele comentou de forma irónica: “Até a minha duplicação de IA está a disputar a febre da computação.”

Grandes linhas da ecologia: roda de CUDA e entra luz, sai cobre

Como sempre, o velho Huang continua a vestir a sua pele. Isso mostra que ele é alguém que gosta do passado. Na conferência, o velho Huang dedicou mais de 20 minutos a rever a estratégia ecológica da NVIDIA.

“Vamos criar mercados para o futuro, não servir os mercados existentes.” Ao longo do seu discurso, o velho Huang recuou no tempo para explicar a trajetória do CUDA: desde ser gozado como um brinquedo para cientistas, até se tornar hoje numa base para a IA.

No roteiro de tecnologia de hardware, o velho Huang assinalou claramente a tendência de “entra luz, sai cobre”: “O cobre já morreu; a luz é o futuro da computação.” Na mais recente plataforma Rubin, o CPO (optics co-packaged, integração ótica em encapsulamento comum) — uma tecnologia que consegue reduzir bastante o consumo de energia por porta — resolve o gargalo de consumo energético nas ligações de alta velocidade. Ao combinar com o processo COUPE, inventado em conjunto com a TSMC, a interface ótica fica diretamente embutida no chip, permitindo uma melhoria revolucionária da eficiência energética.

Todos estes resultados apontam para um único objetivo, uma fábrica de IA. O velho Huang reafirma a sua definição central: “Cada empresa deve construir uma fábrica de IA; a competitividade é medida pela eficiência da fábrica de IA.” Ele acredita que a concorrência das empresas no futuro já não será apenas uma disputa de tecnologia ou de talentos, mas sim de quem consegue gerar Token com menor custo e maior eficiência.

“Agora a inferência tornou-se realidade; os robôs estão a nascer para a IA; e neste momento peçam, em voz alta, o que vocês precisam: mais Token! Engenheiros de IA! Todos em posição!” “Isto não é apenas uma conferência; é a cerimónia de arranque da revolução industrial da inteligência artificial.”

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar