OpenAI revela primeiro chip Jalapeño: tape-out de 9 meses, planeja implantação em nível de gigawatt até o final de 2026

De acordo com o monitoramento da Beating, a OpenAI lançou seu primeiro chip, o Jalapeño, projetado especificamente para acelerar a inferência em grandes modelos de linguagem (LLMs). A OpenAI é responsável pela arquitetura e design do algoritmo do chip, colaborando com a Broadcom e a Celestica para avançar na produção em escala industrial. O Jalapeño visa melhorar diretamente a velocidade de desempenho e reduzir os custos computacionais para ChatGPT, Codex, interfaces de API e futuros produtos de agentes inteligentes. Graças aos modelos de IA de ponta da OpenAI que auxiliaram no design, o Jalapeño alcançou a tape-out apenas 9 meses após sua concepção inicial, estabelecendo um recorde de desenvolvimento mais rápido de um circuito integrado de aplicação específica (ASIC). O chip emprega um co-design de algoritmos e hardware, reestruturando-se em torno de um núcleo dedicado para grandes modelos de linguagem, movimento de dados e arquitetura de rede, alcançando taxas de utilização prática próximas aos limites teóricos de hardware. As primeiras amostras de engenharia executaram com sucesso cargas de trabalho como GPT-5.3-Codex-Spark sob frequência e consumo de energia alvo em laboratório, com testes iniciais mostrando melhorias significativas de eficiência energética em relação aos dispositivos de computação topo de linha existentes. Na cadeia de suprimentos de tecnologia, a Broadcom é a principal responsável pela implementação de silício e conectividade de rede do Jalapeño, integrando o chip Tomahawk, enquanto a Celestica fornece suporte para integração de placas, racks e sistemas. Como o primeiro produto em um roteiro de plataforma de computação multigeracional, o Jalapeño está programado para implantação inicial em larga escala em data centers supergrandes de nível gigawatt em colaboração com parceiros como a Microsoft até o final de 2026, visando expandir as capacidades da plataforma full-stack e reduzir os custos de inferência.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários