Anthropic está buscando a Samsung para fabricar chips de IA, e a história de foundry da Samsung ganhou mais um trunfo?

TL;DR
· A Anthropic está explorando o desenvolvimento de seus próprios chips de servidor de IA, mas ainda não confirmou design, fabricação ou cronograma de produção.
· A OpenAI já divulgou o chip de inferência Jalapeño e iniciou os testes, com planos de implantação até o final de 2026.
· A Samsung pode se beneficiar da tendência de terceirização de chips de IA, mas a Anthropic ainda depende da capacidade computacional da AWS, Google e Nvidia no curto prazo.

As discussões em torno do desenvolvimento de chips de servidor de IA próprios pela Anthropic estão se intensificando, mas ainda não se trata de uma linha de pedidos de chips já concretizada. O foco externo está no custo de inferência por trás do Claude, no fornecimento de GPUs, na energia elétrica dos data centers e na capacidade de racks, que estão se tornando restrições rígidas para as empresas de grandes modelos. A OpenAI já revelou o chip de inferência Jalapeño, feito em parceria com a Broadcom, e a Anthropic também foi vista avaliando chips especializados mais adequados para seus próprios modelos. No entanto, com base nas informações públicas disponíveis, ainda não está confirmado se a Samsung participará da fabricação ou se o projeto entrou em design formal.

A Anthropic ainda está em exploração inicial, não na véspera da produção em massa

A direção explorada pela Anthropic envolve um chip de servidor mais adequado ao funcionamento de seus próprios modelos de IA. Em comparação com GPUs genéricas, se o chip personalizado for bem-sucedido, pode reduzir custos em tarefas específicas de inferência, aumentar a eficiência energética e diminuir a dependência do fornecimento externo de chips.

A dificuldade desse tipo de chip não está apenas no desempenho de um único chip. As empresas de grandes modelos precisam lidar simultaneamente com velocidade de computação, largura de banda de memória, redes de interconexão, consumo de energia, dissipação de calor e estabilidade do cluster. O verdadeiro desafio é fazer com que milhares de chips trabalhem de forma estável e coordenada em um data center, atendendo continuamente às tarefas de treinamento ou inferência.

Atualmente, a descrição mais prudente é que a Anthropic ainda está em fase inicial de avaliação e definição. Quais tarefas principais de IA o chip assumirá, como serão definidas as metas de desempenho e consumo, como será a adaptação no nível do servidor e do cluster, e se será necessária a participação de uma empresa externa de design de chips — todas essas questões ainda não têm respostas públicas claras.

A comunicação externa da empresa também permanece cautelosa. Em abril deste ano, a Anthropic anunciou a expansão da parceria com a Amazon, com investimentos de mais de US$ 100 bilhões em tecnologia AWS na próxima década, garantindo até 5 GW de capacidade, e afirmou já ter usado mais de 1 milhão de chips Trainium2 para treinar e atender o Claude. A Anthropic também enfatizou uma estratégia de hardware diversificada, mas a AWS continua sendo sua principal provedora de treinamento e serviços em nuvem.

Isso significa que, mesmo que a exploração de chips personalizados avance, dificilmente substituirá os fornecedores existentes no curto prazo. AWS Trainium, Google TPU e Nvidia GPU continuam sendo componentes importantes do sistema de poder computacional em escala da Anthropic.

OpenAI deu o primeiro passo, e a pressão do custo de inferência é mais direta

O fato de a Anthropic estar agora sendo incluída nas discussões sobre chips personalizados tem como pano de fundo importante a referência já estabelecida pela OpenAI.

De acordo com o comunicado oficial da Broadcom, a OpenAI e a Broadcom lançaram o Jalapeño em 24 de junho de 2026, posicionado como um acelerador para inferência de grandes modelos de linguagem, também chamado de Intelligence Processor. OpenAI e Broadcom afirmam que o chip levou cerca de 9 meses desde o design inicial até a fabricação, com amostras de engenharia já em operação no laboratório, e planejam iniciar a implantação até o final de 2026.

É necessário distinguir duas fases aqui. O Jalapeño já foi lançado e está em teste, mas isso não significa que esteja em uso comercial em larga escala. Ele representa que as principais empresas de modelos estão começando a incorporar o custo de inferência em um controle mais profundo do hardware, mas não que a demanda por GPUs será imediatamente substituída.

Inferência é o processo computacional em que o modelo gera respostas após um usuário fazer uma pergunta a produtos como ChatGPT, Claude etc. Em comparação com o treinamento, a inferência ocorre com mais frequência e, à medida que a base de usuários cresce, a pressão sobre os custos continua aumentando. Para empresas de grandes modelos, mesmo que o custo de uma única inferência caia uma pequena proporção, quando aplicado a um grande volume de solicitações e despesas de longo prazo com data centers, pode se tornar uma economia significativa.

O ritmo da Anthropic está claramente mais cedo. A empresa não divulgou especificações do chip, nem indicadores de desempenho, lista de parceiros ou cronograma de produção. O avanço da OpenAI apenas mostra ao mercado uma direção: as empresas mais importantes de modelos não estão mais apenas comprando GPUs, mas também tentando colocar parte da infraestrutura de poder computacional sob seu próprio controle.

A imaginação sobre a Samsung aumenta, mas o pedido não está fechado

O motivo pelo qual a Samsung chama a atenção do mercado é que ela possui capacidade de fabricação avançada e está buscando mais oportunidades de foundry para chips de IA. Após o surgimento de notícias sobre financiamento e parcerias de infraestrutura da Anthropic, naturalmente se associou a Samsung a oportunidades potenciais de fabricação de aceleradores de IA.

No entanto, é preciso moderar essa expectativa. As informações públicas confirmam que empresas como Samsung, SK Hynix e Micron já apareceram em discussões sobre parceiros de infraestrutura da Anthropic. A Micron anunciou em 22 de junho de 2026 um acordo estratégico com a Anthropic, incluindo design de arquitetura de IA para memória e armazenamento, acordos de fornecimento, adoção interna do Claude pela Micron e um investimento estratégico na Série H da Anthropic.

Esses sinais de parceria não podem ser diretamente equiparados a um pedido de chip personalizado da Anthropic para a Samsung. Quanto à afirmação de que a Anthropic já teria entrado em contato com a Samsung para cooperação em fabricação, as informações publicamente verificáveis não são suficientes. Uma avaliação mais prudente é que, se o projeto de chip personalizado da Anthropic avançar para a fase de fabricação, a Samsung pode se tornar um dos potenciais participantes observados pelo mercado, mas atualmente não é possível escrever isso como uma transação confirmada.

Para projetos de chips, desde a avaliação inicial até a produção em massa, ainda é necessário passar pela definição da arquitetura, verificação do design, seleção do processo de fabricação, empacotamento, teste e coordenação da cadeia de suprimentos. Enquanto o design do chip não estiver finalizado, o papel do foundry também dificilmente será definido.

Contratações aumentam a credibilidade, mas o caminho ainda não está definido

As movimentações de talentos tornaram as pistas de hardware da Anthropic mais atraentes. Segundo relatos, Clive Chan, membro inicial da equipe de chips personalizados da OpenAI, já ingressou na Anthropic. Informações públicas mostram que ele participou da construção inicial da equipe de chips da OpenAI e também tem experiência relacionada ao Tesla Dojo. Recentemente, a Anthropic também tem intensificado a contratação de engenheiros de chips.

Isso indica que a empresa está pelo menos se preparando para capacidades de hardware. Para uma empresa de modelos, uma equipe de hardware que entende de modelos, cargas de inferência e sistemas de data centers pode ajudar a determinar quais tarefas são adequadas para chips personalizados e quais ainda devem depender de GPUs, TPUs ou chips de provedores de nuvem.

No entanto, a entrada de talentos e a expansão das contratações ainda são apenas sinais de investimento inicial. A continuidade do projeto depende se o chip pode obter vantagens suficientes em custo, desempenho, consumo de energia e complexidade de implantação. Se o chip personalizado só puder melhorar a eficiência no papel, mas não puder operar de forma estável em larga escala, ou se os custos de fabricação e adaptação de software forem muito altos, a empresa ainda pode continuar dependendo principalmente de chips externos.

Este também é o motivo pelo qual a Nvidia é difícil de ser substituída no curto prazo. As GPUs da Nvidia continuam sendo a principal força em treinamento e inferência de IA, com um ecossistema de software maduro, e os clientes de data centers já construíram muitos sistemas em torno de sua plataforma. Os chips personalizados provavelmente assumirão parte do trabalho em cenários específicos de inferência, em vez de substituir completamente as GPUs.

Para os investidores, o impacto real da discussão sobre chips personalizados da Anthropic, no curto prazo, se assemelha mais a um jogo de cadeia de suprimentos. As principais empresas de modelos desejam obter mais opções de poder computacional, e provedores de nuvem, Broadcom, Samsung, TSMC, fabricantes de memória e a cadeia de suprimentos de empacotamento avançado podem se beneficiar dessa tendência. No entanto, no caso da Anthropic, os fatos claros ainda são limitados: a exploração de chips personalizados ainda está em estágio inicial, o papel da Samsung não está confirmado, e o poder computacional em escala do Claude ainda depende da AWS, Google e Nvidia.

Clique para saber mais sobre as vagas abertas na BlockBeats

Bem-vindo ao grupo oficial da BlockBeats:

Canal de inscrição no Telegram: https://t.me/theblockbeats

Grupo de discussão no Telegram: https://t.me/BlockBeats_App

Conta oficial no Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado