De “Festa do Lagostim” a “Bolo de Cinco Camadas”: Como é que Jensen Huang pretende explorar o potencial do ouro da IA?

robot
Geração de resumo em curso

倪雨晴, jornalista da 21st Century Business Herald

Nos últimos dois anos, a vaga da IA generativa varreu o mundo, a procura por capacidade computacional disparou e as GPUs tornaram-se o recurso mais cobiçado em toda a cadeia industrial.

Como força motriz central desta revolução da infraestrutura de IA, o fundador e CEO da NVIDIA, Huang Renxun, e a NVIDIA que ele lidera, encontram-se quase na posição mais crucial da indústria de IA.

No entanto, à medida que a oferta de capacidade computacional continua a expandir-se, surge também gradualmente uma nova questão: quando há cada vez mais “pás”, onde está o verdadeiro “filão de ouro”?

Recentemente, Huang Renxun fez uma publicação rara, propondo a metáfora do “bolo de cinco camadas de IA”, que divide o ecossistema de IA em cinco níveis: energia, chips, infraestrutura, modelos e aplicações.

(Fonte da imagem: NVIDIA)

Esta metáfora, à primeira vista simples, na realidade reflecte uma nova reflexão sobre a estrutura da indústria de IA. A IA não é apenas uma competição entre modelos; é um projecto de sistema que abrange toda a pilha tecnológica.

Também merece atenção que, para além de enfatizar a capacidade computacional e a infraestrutura, Huang Renxun começou a falar com frequência sobre a importância da camada de aplicações. Segundo informações recentes, a NVIDIA estará a preparar o lançamento de uma plataforma open source de agentes de IA (Agent), a NemoClaw, principalmente destinada ao ecossistema de software empresarial. Até ao momento, a NVIDIA não comentou a NemoClaw; na próxima conferência anual da NVIDIA, a GTC, Huang Renxun revelará tudo sobre os mais recentes chips e a IA.

É possível ver que, depois de o OpenClaw (apelido “caranguejo-lagosta”) ter explodido em popularidade, a NVIDIA também quer juntar-se à “festa dos caranguejos-lagosta”, mirando os agentes de IA. À medida que a capacidade de fornecimento de IA continua a aumentar, apenas com o surgimento contínuo de novos cenários de aplicação é que o ecossistema industrial poderá continuar a expandir-se.

Da “caranguejo-lagosta” de IA ao “bolo de cinco camadas”, e depois ao foco no ecossistema de aplicações, Huang Renxun está a contar uma nova história para a indústria de IA: como continuar a descobrir novos veios minerais sobre um filão que já foi escavado.

Bolo de cinco camadas: redefinir a estrutura da indústria de IA

Como figura central nesta vaga de capacidade computacional, Huang Renxun tem vindo a actualizar continuamente as suas descrições sobre a estrutura da indústria de IA. Dos três grandes estágios do ano passado, à teoria mais recente do “bolo de cinco camadas de IA”, na verdade tudo procura responder à mesma questão: onde é que o valor da indústria de IA é gerado e como é que ele irá continuar a expandir-se.

O chamado “bolo de cinco camadas de IA” é uma metáfora figurativa usada por Huang Renxun para descrever a pilha tecnológica da indústria de IA. De acordo com este enquadramento, o sistema de IA pode ser dividido, de forma geral, em cinco níveis: a camada mais abaixo é a energia; em seguida vêm a computação em chips; depois, acima, vêm data centers e infraestrutura de cloud; a seguir vêm os modelos de IA; e, no topo, estão as aplicações. As cinco camadas, em conjunto, constituem a estrutura tecnológica completa da indústria de IA.

Esta teoria parece ser um resumo da arquitectura tecnológica, mas isso implica que a competição em IA não é uma disputa apenas de uma tecnologia, e sim uma corrida ao nível de ecossistema.

Na indústria de IA actual, a NVIDIA ocupa, sem dúvida, a posição central mais na base. A capacidade de computação das GPUs tornou-se a infraestrutura para treino e inferência de IA, e o ecossistema de software CUDA vem ainda reforçar esta vantagem. No entanto, à medida que o tamanho do mercado de IA se expande rapidamente, a NVIDIA também enfrenta preocupações.

Um especialista sénior em software disse ao jornalista da 21st Century Business Herald que, na vaga de Internet do passado, os fornecedores de infraestrutura só precisavam de fornecer ferramentas e a inovação nas aplicações surgia rapidamente; mas na era da IA, o ecossistema de aplicações não apareceu de forma sincronizada.

É precisamente por essa razão que Huang Renxun tem vindo a enfatizar com frequência a importância da camada de aplicações. Por outras palavras, embora a oferta de capacidade computacional de IA seja cada vez mais forte, os cenários de aplicação que realmente conseguem absorver esta capacidade ainda são limitados.

Na era da caça ao ouro, quem vende pás não precisa de provar que existe ouro, porque os mineiros vão procurar por conta própria. Mas quando a capacidade de produção de pás se torna forte e dá origem a um volume industrial ainda maior, quem vende pás precisa, pelo contrário, de se colocar à frente e dizer ao mercado: “aqui ainda há ouro”.

De certo modo, o “bolo de cinco camadas de IA” está precisamente a cumprir esta reconfiguração do discurso. Ao dividir a indústria de IA em múltiplos níveis, Huang Renxun está, na prática, a sublinhar que a IA não pertence apenas às empresas de modelos, nem apenas aos programadores de aplicações; é um enorme ecossistema que exige a participação de várias partes.

Mais importante ainda, este desenho por camadas também está a redistribuir o espaço de imaginação sobre a indústria de IA. Na era tradicional do software, o valor concentrava-se sobretudo na camada de aplicações; mas na era da IA, energia, computação e infraestrutura também se tornam novos centros de valor. Através deste tipo de narrativa, o “bolo” da indústria de IA é ampliado de novo: não só as empresas de modelos e os fornecedores de aplicações têm oportunidade de lucrar, como também os fornecedores de infraestrutura são igualmente beneficiários-chave.

Por outras palavras, ao propor o “bolo de cinco camadas”, em essência, está-se a procurar uma nova narrativa de crescimento para a indústria de IA.

Quando a capacidade computacional de IA já se tornou uma realidade, o problema-chave a seguir deixa de ser se a tecnologia pode ser concretizada, passando a ser como é que todo o ecossistema consegue continuar a expandir-se. Só quando mais empresas e programadores acreditarem que ainda existe um enorme “filão de ouro” na indústria de IA é que a economia da capacidade computacional pode continuar a funcionar.

NVIDIA constrói um “matriz de IA em três camadas”

Se o “bolo de cinco camadas de IA” descreve a estrutura da indústria, então a estratégia da própria NVIDIA parece, ainda mais, construir nessa “torta” uma espécie de “estrutura de poder” sólida. Nos últimos anos, a NVIDIA tem vindo a formar, gradualmente, uma disposição clara de três camadas: capacidade computacional, infraestrutura e ecossistema de aplicações.

A primeira camada é o domínio da capacidade computacional. Como principal fornecedora de GPUs, a NVIDIA tornou-se a infraestrutura central global para treino e inferência de IA. Os chips de IA continuam a elevar o desempenho, enquanto a plataforma de software CUDA cria uma barreira tecnológica extremamente elevada. Esta camada corresponde precisamente à camada de chips no “bolo de cinco camadas de IA” e também é a parte com maior margem de lucro para a NVIDIA.

A segunda camada é a infraestrutura de IA. À medida que o tamanho dos modelos de IA continua a aumentar, uma única GPU já não consegue dar resposta às necessidades, e clusters de capacidade computacional em nível de data center passam a ser a nova forma de infraestrutura. A NVIDIA propôs o conceito de “AI Factory”, lançou NVLink, NVSwitch e uma arquitectura de supernó (super node), integrando GPUs, rede e software num sistema completo de capacidade computacional. Isto significa que a NVIDIA deixa de ser apenas uma empresa de venda de chips, passando a fornecer uma linha de produção completa de IA.

Huang Renxun sublinhou: “A IA é uma transformação a nível industrial; vai mudar a forma de produzir energia, construir fábricas, organizar o trabalho e o modelo de crescimento económico.” Ele considera que, neste momento, a IA ainda está numa fase inicial: grande parte da infraestrutura ainda não foi construída, e muitos talentos ainda não foram formados; a IA está a tornar-se a infraestrutura do mundo moderno.

E, para o futuro, é especialmente digno de atenção o terceiro nível: aplicações e ecossistema. No diagrama do bolo de cinco camadas de Huang Renxun, a área ocupada pelas aplicações é a maior.

Durante muito tempo, o ecossistema da NVIDIA concentrou-se em programadores e grandes clientes empresariais, enquadrando-se num ecossistema típico do lado B (B2B). Em contraste, empresas de tecnologia como a Apple constroem uma rede industrial mais ampla através do ecossistema de aplicações. A Apple não vende apenas hardware; mais importante ainda, forma uma economia de programadores através da App Store, permitindo que toda a plataforma continue próspera.

Este é exactamente o problema-chave que a NVIDIA enfrenta actualmente. A capacidade computacional já é extremamente forte, mas os cenários de aplicação ainda são insuficientes. Se a tecnologia de IA não conseguir transformar-se em oportunidades comerciais mais amplas, a procura por capacidade computacional acabará por encontrar um limite.

Por isso, a NVIDIA começou a envolver-se de forma mais proactiva na construção do ecossistema de aplicações. O plano de plataforma de agentes de IA, NemoClaw, que circulou recentemente no mercado, é visto como um sinal importante de a NVIDIA se estender à camada de aplicações. Ao fornecer frameworks de desenvolvimento e ferramentas de plataforma, e ao apoiar plataformas de chips externas, a NVIDIA pretende permitir que mais empresas construam os seus próprios sistemas de negócio com base em IA.

Ao discutir recentemente o futuro da camada de aplicações, ele fez ainda uma avaliação: com o desenvolvimento dos agentes de IA, as formas tradicionais de software e APP poderão ser remodeladas, e os utilizadores poderão aceder directamente a vários serviços digitais através de assistentes de IA.

E o papel da NVIDIA não é apenas o de “vendedor de pás” da época. Ao construir um sistema completo, desde a capacidade computacional até às aplicações, procura transformar-se na plataforma base de todo o ecossistema de IA.

Do “bolo de cinco camadas de IA”, à exploração do ecossistema de aplicações, Huang Renxun tem vindo a reconfigurar continuamente a forma como a indústria de IA conta a sua história. O objectivo por detrás disso é, na verdade, bastante claro: fazer com que a indústria de IA não tenha apenas uma capacidade de fornecimento forte, mas também consiga continuar a criar novas procura.

Só quando mais empresas e programadores conseguirem de facto escavar “filões de ouro” nesta terra é que a economia de capacidade computacional de IA conseguirá continuar a expandir-se; e a NVIDIA, também, continuará a ocupar uma posição central nesse processo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar