
OpenAI 推出首款自研 AI 推理芯片 Jalapeño 软硬件协同打开算力成本下降空间
6 月 24 日,OpenAI 联合半导体企业博通(Broadcom)正式发布首款自研 AI 推理芯片 Jalapeño。这款以墨西哥辣椒命名的产品定位入门级,也释放出清晰的迭代信号:更高性能的后续芯片已在规划之中。在行业看来,真正撼动芯片与 AI 产业的并非产品命名,而是三组关键数据:9 个月的研发周期、50% 的推理成本降幅,以及 3nm 的制程工艺。
9 个月完成流片 AI 辅助设计刷新行业研发纪录
在全球半导体行业,专用集成电路(ASIC)从架构设计到流片落地,普遍需要 1.5 至 2 年的研发周期,复杂制程的高端芯片周期甚至长达 2 至 3 年。谷歌 TPU、亚马逊 Trainium 等主流 AI 加速芯片,均遵循约两年的迭代节奏。
而 Jalapeño 从零启动架构设计到成功流片,仅用时 9 个月。OpenAI 方面表示,这一速度创下了高性能先进半导体领域史上最快的 ASIC 开发周期。
超短周期的实现,核心依托两大支撑。其一为 AI 深度参与芯片设计流程。OpenAI 调用自家前沿大模型,辅助完成架构探索、功耗仿真、参数调优、布局布线验证等核心环节。芯片设计中最耗费时间的,正是 “设计 — 验证 — 修改 — 再验证” 的反复迭代过程,AI 将原本需要人工耗费 18 至 24 个月的重复性工作大幅压缩。
“最懂大模型运行逻辑的 AI,反过来设计专门适配大模型的硬件”,这一模式形成了技术自增强的正向循环:跑在硬件上的 AI,持续优化下一代硬件的设计效率,实现软硬件的协同进化。其二为全产业链的深度协同。该项目核心负责人出自谷歌 TPU 团队,拥有 AI 辅助芯片架构设计的技术积累;分工层面,OpenAI 负责底层架构设计,博通负责芯片实现与网络技术研发,Celestica 承担板卡与机架集成工作,最终由台积电以 3nm 工艺完成代工。产业链各环节的成熟配合,为研发提速提供了产业基础。
推理成本下降 50% 专用芯片直击算力开销痛点
与通用 GPU 不同,Jalapeño 是专门面向大语言模型推理场景优化的 ASIC 芯片,核心目标是降低规模化推理的单位成本。
博通首席执行官陈福阳透露,早期测试数据显示,Jalapeño 的单位推理成本较当前主流 AI GPU 低约 50%,综合性能可对标英伟达 Blackwell 架构产品与谷歌 TPU。对 OpenAI 而言,这一成本降幅具备极高的商业价值。当前 OpenAI 每年的算力投入达数十亿美元,其中模型训练属于阶段性大额支出,而推理服务则是 7×24 小时持续产生的刚性开销,是算力成本的核心组成部分。Jalapeño 的设计目标,正是兼顾主流加速器的吞吐能力与专用推理系统的低延迟优势,实现效率与成本的平衡。
对终端用户来说,推理成本下探也将带来体验升级:高峰期服务稳定性提升、复杂任务响应延迟缩短、高阶功能的使用门槛逐步降低。即便订阅价格保持不变,用户可获得的实际算力服务也将持续升级。定位供应链多元化 不替代现有算力生态
根据规划,Jalapeño 将于 2026 年底启动规模化部署,联合微软等合作伙伴共建吉瓦级算力数据中心。该芯片及配套系统仅供给 OpenAI 自用,不对外销售。目前 OpenAI 已规划多代芯片路线图,下一代产品预计 2028 年推出。
业内分析指出,自研芯片是 OpenAI 算力供应多元化战略的重要组成部分,并非要替代现有供应链。英伟达、AMD 等厂商的通用芯片,仍将支撑其绝大部分的算力需求。
从全行业视角看,当前谷歌、亚马逊、微软、Meta 等头部科技企业均已布局自研 AI 推理芯片,OpenAI 的入局进一步丰富了算力供给的多元格局,也为下游算力采购方增加了议价空间,推动 AI 算力市场从单一厂商主导向多元供给的方向演进。规模化红利落地 企业级接入优化算力成本
头部厂商自研芯片带来的算力成本下降红利,最终将通过产业传导惠及全行业。对广大中小企业与开发团队而言,无需投入重资产布局底层硬件,通过成熟的一站式 AI 接入服务平台,即可享受到规模化采购带来的成本优惠,快速对接全球前沿的大模型能力。
UseAIAPI 已全面覆盖 Gemini、Claude、ChatGPT、DeepSeek 等全球主流前沿 AI 大模型,可针对不同规模的企业需求提供定制化的企业级接入解决方案,助力团队快速完成技术对接与业务场景落地,无需自行投入大量资源搭建复杂的多模型调度与运维架构。在使用成本层面,平台专属优惠折扣最低可达官方定价的 50%,能够有效缓解高并发调用、批量内容生成、多模态业务部署等场景下的算力支出压力,为企业数字化转型、自动化工作流落地等多元业务需求提供稳定且高性价比的服务支撑。
从行业发展的长期逻辑看,Jalapeño 的真正意义,不止于性能对标行业旗舰产品,更在于验证了 “AI 设计 AI 硬件” 的技术闭环可行性。从大模型软件起家的企业下场布局自研芯片,折射出 AI 行业的竞争重心,正从单一的模型能力比拼,转向软硬件全栈能力与供应链掌控力的综合较量。算力成本的持续下探,也将为 AI 技术在千行百业的深度落地打开更广阔的空间。