据Beating的监测,OpenAI已推出其首款芯片Jalapeño,该芯片专为加速大语言模型(LLMs)的推理而设计。Jalapeño的芯片架构与算法设计由OpenAI负责,并与博通(Broadcom)和Celestica合作,以推进工业规模的量产。Jalapeño旨在直接提升ChatGPT、Codex、API接口以及未来智能代理产品的运行速度,并降低计算成本。得益于OpenAI前沿AI模型对设计的助力,Jalapeño在最初提出设想后仅9个月便实现流片,创下应用特定集成电路(ASIC)最快开发纪录。该芯片采用算法与硬件的协同设计,围绕大语言模型、数据搬运与网络架构的专用核心进行重构,使实际利用率接近硬件理论极限。
首批工程样片已在实验室环境下成功运行诸如GPT-5.3-Codex-Spark等工作负载,达到目标频率与功耗;早期测试显示,其能效相较于现有同类顶级计算设备有显著提升。在技术供应链中,博通主要负责Jalapeño的硅实现与网络连接能力,并集成Tomahawk芯片;Celestica则为板卡、机架与系统集成提供支持。作为多代计算平台路线图中的首款产品,Jalapeño计划在2026年底前与微软等合作伙伴协同,在千兆瓦级超大型数据中心进行初期大规模部署,旨在扩展全栈平台能力并降低推理成本。
164.8万 热度
48.64万 热度
12.88万 热度
19.44万 热度
100.42万 热度
OpenAI 发布首款芯片 Jalapeño:9个月完成流片,计划2026年底前实现千兆瓦级部署
据Beating的监测,OpenAI已推出其首款芯片Jalapeño,该芯片专为加速大语言模型(LLMs)的推理而设计。Jalapeño的芯片架构与算法设计由OpenAI负责,并与博通(Broadcom)和Celestica合作,以推进工业规模的量产。Jalapeño旨在直接提升ChatGPT、Codex、API接口以及未来智能代理产品的运行速度,并降低计算成本。得益于OpenAI前沿AI模型对设计的助力,Jalapeño在最初提出设想后仅9个月便实现流片,创下应用特定集成电路(ASIC)最快开发纪录。该芯片采用算法与硬件的协同设计,围绕大语言模型、数据搬运与网络架构的专用核心进行重构,使实际利用率接近硬件理论极限。
首批工程样片已在实验室环境下成功运行诸如GPT-5.3-Codex-Spark等工作负载,达到目标频率与功耗;早期测试显示,其能效相较于现有同类顶级计算设备有显著提升。在技术供应链中,博通主要负责Jalapeño的硅实现与网络连接能力,并集成Tomahawk芯片;Celestica则为板卡、机架与系统集成提供支持。作为多代计算平台路线图中的首款产品,Jalapeño计划在2026年底前与微软等合作伙伴协同,在千兆瓦级超大型数据中心进行初期大规模部署,旨在扩展全栈平台能力并降低推理成本。