OpenAI 推出首款自研 AI 推理芯片 Jalapeño 软硬件协同打开算力成本下降空间

6 月 24 日，OpenAI 联合半导体企业博通（Broadcom）正式发布首款自研 AI 推理芯片 Jalapeño。这款以墨西哥辣椒命名的产品定位入门级，也释放出清晰的迭代信号：更高性能的后续芯片已在规划之中。在行业看来，真正撼动芯片与 AI 产业的并非产品命名，而是三组关键数据：9 个月的研发周期、50% 的推理成本降幅，以及 3nm 的制程工艺。

9 个月完成流片 AI 辅助设计刷新行业研发纪录

在全球半导体行业，专用集成电路（ASIC）从架构设计到流片落地，普遍需要 1.5 至 2 年的研发周期，复杂制程的高端芯片周期甚至长达 2 至 3 年。谷歌 TPU、亚马逊 Trainium 等主流 AI 加速芯片，均遵循约两年的迭代节奏。

而 Jalapeño 从零启动架构设计到成功流片，仅用时 9 个月。OpenAI 方面表示，这一速度创下了高性能先进半导体领域史上最快的 ASIC 开发周期。

超短周期的实现，核心依托两大支撑。其一为 AI 深度参与芯片设计流程。OpenAI 调用自家前沿大模型，辅助完成架构探索、功耗仿真、参数调优、布局布线验证等核心环节。芯片设计中最耗费时间的，正是 “设计 — 验证 — 修改 — 再验证” 的反复迭代过程，AI 将原本需要人工耗费 18 至 24 个月的重复性工作大幅压缩。

“最懂大模型运行逻辑的 AI，反过来设计专门适配大模型的硬件”，这一模式形成了技术自增强的正向循环：跑在硬件上的 AI，持续优化下一代硬件的设计效率，实现软硬件的协同进化。

其二为全产业链的深度协同。该项目核心负责人出自谷歌 TPU 团队，拥有 AI 辅助芯片架构设计的技术积累；分工层面，OpenAI 负责底层架构设计，博通负责芯片实现与网络技术研发，Celestica 承担板卡与机架集成工作，最终由台积电以 3nm 工艺完成代工。产业链各环节的成熟配合，为研发提速提供了产业基础。

推理成本下降 50% 专用芯片直击算力开销痛点

与通用 GPU 不同，Jalapeño 是专门面向大语言模型推理场景优化的 ASIC 芯片，核心目标是降低规模化推理的单位成本。

博通首席执行官陈福阳透露，早期测试数据显示，Jalapeño 的单位推理成本较当前主流 AI GPU 低约 50%，综合性能可对标英伟达 Blackwell 架构产品与谷歌 TPU。

对 OpenAI 而言，这一成本降幅具备极高的商业价值。当前 OpenAI 每年的算力投入达数十亿美元，其中模型训练属于阶段性大额支出，而推理服务则是 7×24 小时持续产生的刚性开销，是算力成本的核心组成部分。Jalapeño 的设计目标，正是兼顾主流加速器的吞吐能力与专用推理系统的低延迟优势，实现效率与成本的平衡。

对终端用户来说，推理成本下探也将带来体验升级：高峰期服务稳定性提升、复杂任务响应延迟缩短、高阶功能的使用门槛逐步降低。即便订阅价格保持不变，用户可获得的实际算力服务也将持续升级。

定位供应链多元化不替代现有算力生态

根据规划，Jalapeño 将于 2026 年底启动规模化部署，联合微软等合作伙伴共建吉瓦级算力数据中心。该芯片及配套系统仅供给 OpenAI 自用，不对外销售。目前 OpenAI 已规划多代芯片路线图，下一代产品预计 2028 年推出。

业内分析指出，自研芯片是 OpenAI 算力供应多元化战略的重要组成部分，并非要替代现有供应链。英伟达、AMD 等厂商的通用芯片，仍将支撑其绝大部分的算力需求。

从全行业视角看，当前谷歌、亚马逊、微软、Meta 等头部科技企业均已布局自研 AI 推理芯片，OpenAI 的入局进一步丰富了算力供给的多元格局，也为下游算力采购方增加了议价空间，推动 AI 算力市场从单一厂商主导向多元供给的方向演进。

规模化红利落地企业级接入优化算力成本

头部厂商自研芯片带来的算力成本下降红利，最终将通过产业传导惠及全行业。对广大中小企业与开发团队而言，无需投入重资产布局底层硬件，通过成熟的一站式 AI 接入服务平台，即可享受到规模化采购带来的成本优惠，快速对接全球前沿的大模型能力。

UseAIAPI 已全面覆盖 Gemini、Claude、ChatGPT、DeepSeek 等全球主流前沿 AI 大模型，可针对不同规模的企业需求提供定制化的企业级接入解决方案，助力团队快速完成技术对接与业务场景落地，无需自行投入大量资源搭建复杂的多模型调度与运维架构。在使用成本层面，平台专属优惠折扣最低可达官方定价的 50%，能够有效缓解高并发调用、批量内容生成、多模态业务部署等场景下的算力支出压力，为企业数字化转型、自动化工作流落地等多元业务需求提供稳定且高性价比的服务支撑。

从行业发展的长期逻辑看，Jalapeño 的真正意义，不止于性能对标行业旗舰产品，更在于验证了 “AI 设计 AI 硬件” 的技术闭环可行性。从大模型软件起家的企业下场布局自研芯片，折射出 AI 行业的竞争重心，正从单一的模型能力比拼，转向软硬件全栈能力与供应链掌控力的综合较量。算力成本的持续下探，也将为 AI 技术在千行百业的深度落地打开更广阔的空间。

OpenAI 推出首款自研 AI 推理芯片 Jalapeño 软硬件协同打开算力成本下降空间

9 个月完成流片 AI 辅助设计刷新行业研发纪录

推理成本下降 50% 专用芯片直击算力开销痛点

定位供应链多元化 不替代现有算力生态

规模化红利落地 企业级接入优化算力成本

定位供应链多元化不替代现有算力生态

规模化红利落地企业级接入优化算力成本