Aviso de capacidade computacional: Google impõe discretamente limite de uso do Gemini ao Meta

robot
Geração do resumo em andamento

A contradição entre oferta e demanda de infraestrutura de inteligência artificial está se intensificando entre as principais empresas de tecnologia globais. Segundo fontes, o Google informou à Meta por volta de março deste ano que não poderia atender a todas as suas necessidades de capacidade computacional do Gemini e impôs um limite de uso para o gigante das mídias sociais – mesmo o maior provedor de serviços de IA do mundo tem dificuldade em lidar com a demanda avassaladora por capacidade computacional.

De acordo com o Financial Times, essas restrições ainda não foram removidas e já causaram interferência e atrasos em vários projetos internos de IA da Meta. Como resultado, a Meta pediu que seus funcionários aumentassem a eficiência do uso de capacidade computacional de IA e implementasse um uso criterioso de tokens de IA internamente. Google e Meta se recusaram a comentar.

Essa situação forçou o Google a acelerar o ritmo de expansão. No início deste mês, o Google assinou um acordo de locação de capacidade computacional com a SpaceX, de Elon Musk, no valor de US$ 920 milhões por mês. O CEO do Google, Sundar Pichai, afirmou durante a teleconferência de resultados do primeiro trimestre deste ano: "Recentemente, temos enfrentado restrições em relação à capacidade computacional. Se conseguíssemos atender à demanda, a receita do negócio de nuvem seria maior."

A Meta não é um caso isolado. Várias fontes apontam que outros clientes corporativos do Google também enfrentam restrições em graus variados, sendo a Meta a mais afetada devido à escala excepcionalmente grande de sua demanda. Este incidente reflete o crescimento explosivo da carga de trabalho de inferência de IA, que se tornou um dos maiores desafios enfrentados por toda a indústria.

Gargalo de capacidade computacional continua pressionando, grandes clientes são os primeiros a sentir

Embora as grandes empresas de tecnologia tenham investido centenas de bilhões de dólares em chips, data centers e fornecimento de energia, a oferta de capacidade computacional de IA ainda não consegue acompanhar o ritmo do crescimento da demanda.

No primeiro trimestre, a receita do negócio de nuvem do Google ultrapassou US$ 20 bilhões pela primeira vez, e o backlog de contratos de nuvem assinados mas ainda não entregues quase dobrou em relação ao trimestre anterior, ultrapassando US$ 460 bilhões. Pichai afirmou claramente que as restrições de capacidade computacional continuarão no curto prazo.

Nesse contexto, o impacto sobre a Meta é particularmente notável. Fontes afirmam que foi justamente a alta demanda de grandes clientes corporativos como a Meta que impulsionou diretamente o Google a acelerar a busca por fontes externas de capacidade computacional. Com a implantação em larga escala de chatbots, assistentes de programação e agentes de IA pelas empresas, a carga de trabalho de inferência – ou seja, a capacidade computacional consumida ao executar tarefas em aplicações reais após o treinamento do modelo – está se tornando o gargalo central do setor.

Projetos internos da Meta enfrentam obstáculos, acelerando a migração para modelos próprios

A Meta usa amplamente o Gemini internamente, abrangendo a moderação de segurança da plataforma (incluindo identificação de conteúdo fraudulento e remoção de informações prejudiciais), chatbots de atendimento ao cliente e assistência de anúncios, bem como alguns fluxos de trabalho internos e desenvolvimento de código, utilizando também outros modelos como o Claude, da Anthropic.

Segundo fontes, a Meta escolheu inicialmente o Gemini porque seu desempenho era superior ao do modelo aberto Llama, desenvolvido internamente pela empresa. No entanto, com o aperto das restrições de capacidade computacional, a Meta está acelerando a migração para modelos próprios. Várias fontes afirmam que a Meta recentemente começou a priorizar a promoção de seu novo modelo Muse Spark, que é considerado capaz de rivalizar com o Gemini em desempenho, ajudando a reduzir a dependência de modelos externos.

O CEO da Meta, Mark Zuckerberg, tem aumentado continuamente os investimentos em talentos e infraestrutura de IA, dedicando-se a criar o que chama de "superinteligência pessoal". Diferente do Google, a Meta não possui um negócio de nuvem e está acelerando a construção de seu próprio sistema de data centers, comprometendo-se a investir cumulativamente US$ 600 bilhões nos Estados Unidos até 2028.

Google expande via SpaceX, setor busca soluções

Diante da pressão de capacidade computacional, o Google assinou este mês um acordo de locação de capacidade computacional com a SpaceX no valor de US$ 920 milhões por mês para preencher a lacuna de infraestrutura. O laboratório de IA Anthropic também fechou um acordo semelhante com a SpaceX no mês passado.

A imposição de restrições pelo Google à Meta fornece ao mundo uma rara janela para vislumbrar a pressão real enfrentada pelos principais provedores de serviços de IA do mundo na alocação de capacidade computacional. Atualmente, o gargalo de infraestrutura em toda a indústria de IA está se espalhando do lado do treinamento para o lado da inferência, e a resolução do desequilíbrio entre oferta e demanda ainda depende da concretização de uma nova rodada de investimentos maciços de capital.

Aviso de Risco e Isenção de Responsabilidade

O mercado tem riscos, invista com cautela. Este artigo não constitui aconselhamento de investimento pessoal e não leva em consideração os objetivos de investimento específicos, a situação financeira ou as necessidades de usuários individuais. Os usuários devem considerar se quaisquer opiniões, pontos de vista ou conclusões neste artigo são adequados às suas circunstâncias específicas. O investimento com base nele é de responsabilidade própria.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários