OpenAI Apresenta Primeiro Chip Jalapeño: Tape-Out de 9 Meses, Planeia Implantação a Nível de Gigawatt até ao Final de 2026

Segundo monitorização da Beating, a OpenAI lançou o seu primeiro chip, o Jalapeño, especificamente concebido para acelerar a inferência em modelos de linguagem de grande escala (LLMs). A OpenAI é responsável pela arquitetura e conceção algorítmica do chip, colaborando com a Broadcom e a Celestica para avançar a produção à escala industrial. O Jalapeño visa melhorar diretamente a velocidade de desempenho e reduzir os custos computacionais do ChatGPT, Codex, interfaces API e futuros produtos de agentes inteligentes. Graças aos modelos de IA de ponta da OpenAI que auxiliaram na conceção, o Jalapeño atingiu a tape-out apenas 9 meses após a sua conceção inicial, estabelecendo um recorde de desenvolvimento mais rápido de um circuito integrado de aplicação específica (ASIC). O chip emprega um co-design de algoritmos e hardware, reestruturando-se em torno de um núcleo dedicado para modelos de linguagem de grande escala, movimento de dados e arquitetura de rede, alcançando taxas de utilização prática próximas dos limites teóricos do hardware. As primeiras amostras de engenharia executaram com sucesso cargas de trabalho como o GPT-5.3-Codex-Spark sob frequência e consumo de energia alvo em laboratório, com testes iniciais a mostrarem melhorias significativas na eficiência energética em relação aos dispositivos informáticos de topo existentes. Na cadeia de fornecimento tecnológica, a Broadcom é principalmente responsável pela implementação de silício e conectividade de rede do Jalapeño, integrando o chip Tomahawk, enquanto a Celestica fornece suporte para integração de placas, racks e sistemas. Como primeiro produto de um roteiro de plataforma computacional multigeracional, o Jalapeño está programado para uma implementação inicial em larga escala em centros de dados superdimensionados ao nível do gigawatt, em colaboração com parceiros como a Microsoft, até ao final de 2026, com o objetivo de expandir as capacidades da plataforma full-stack e reduzir os custos de inferência.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado