17611538698
info@21cto.com

OpenAI 推出自研芯片 Jalapeño,欲打破英伟达 GPU 垄断

人工智能 0 16 1小时前
图片

导读:OpenAI宣布发布自研芯片Jalapeño。

2026 年 6 月 24 日,OpenAI 正式对外亮相首款自研定制 AI 推理芯片 Jalapeño(翻译过来是墨西哥辣椒)。

这款芯片由 OpenAI 与博通(Broadcom)联合设计、生产,完全针对自家大模型推理负载深度优化,甚至 OpenAI 自有 AI 模型全程参与芯片设计环节。目前芯片仍处于测试阶段,但实测数据显示,它的单位功耗性能大幅领先市面现有高端算力芯片。

图片
奥特曼与博通CEO之合作照片(图片来源:X)

其实业内早传有 OpenAI 自研芯片的相关传闻。在 2025 年初路透社就披露过相关规划,双方合作也在 2025 年 10 月官宣落地。如今实体芯片顺利亮相,意味着 OpenAI 已经打通从芯片架构设计、流片制造到功能验证的完整硬件链路,落地速度业已超出行业预期。

自研定制芯片,直击英伟达 GPU 两大痛点


近五年全球 AI 训练、其推理市场几乎被英伟达(Nvidia) GPU 垄断,GPT、Claude、Gemini 等主流大模型均依托 H100、B200 系列硬件运行,但通用 GPU 的短板日益凸显。

当前AI硬件基础设施的状态是这样的:一方面是成本与供货难题,高端 GPU 定价居高不下,长期供不应求,持续拉高 AI 企业运营开支;另一方面,GPU 面向通用并行计算开发,并未针对 Transformer 架构、大模型推理场景做专项优化,硬件资源存在大量浪费。这也给定制 ASIC 芯片留出巨大优化空间:贴合自有模型计算逻辑的专用硅片,理论能效能够实现数倍提升。

谷歌早已依靠 TPU 走出这条自研路线,从 2016 年迭代至今已是第六代,全面支撑内部模型训练与推理;亚马逊紧随其后,推出 Inferentia 推理芯片、Trainium 训练芯片,为 AWS 客户提供英伟达之外的算力选择。Jalapeño 的发布,宣告 OpenAI 正式加入自研芯片赛道。

合作从来不是从零起步:博通深耕定制 ASIC 数十年,曾为谷歌 TPU、Meta 推荐加速器完成硬件开发,具备成熟的硅片工程能力;OpenAI 则掌握大模型底层计算逻辑,二者形成算法 + 硬件的互补组合。

博通的入局也重塑了 AI 产业链格局。不同于英特尔、AMD 售卖标准化通用芯片,博通专注为大厂定制专属硅片,如今它将头部 AI 企业列为核心长期客户,意味着算力产业链的话语权正在发生转移。

OpenAI 总裁兼联合创始人 Greg Brockman 曾在内部播客解读硬件战略:团队对自身模型运行逻辑有着透彻理解,通用 GPU 很难适配部分专属计算场景,这类场景恰好是定制芯片的优化重点。

Jalapeño 芯片将聚焦推理场景,也就是用户发送提问、模型生成回复的全过程,官方重点强调其在实时编程类模型上的低成本优势,对于 Codex 这类低延迟、高并发 AI 代理产品,能直接改善单位收益。

AI 参与芯片设计,形成软硬件自举闭环


本次芯片有一个极具行业意义的细节:OpenAI 大模型深度参与芯片研发。布局布线、电源设计、时序收敛等环节存在海量组合优化空间,恰好契合大模型搜索、推演的能力优势。

早在 2020 年,DeepMind 就用强化学习优化 TPU 芯片布局并落地量产,而 OpenAI 把这套思路延伸到自家推理芯片,实现了 “AI 设计运行 AI 的芯片”,完成软硬件双向赋能的自举循环。

观察其自研芯片背后,是 OpenAI 全栈垂直整合的长期战略。

官方表示,公司不止打磨大模型与上层应用,还自主掌控芯片架构、内核、内存、网络、调度部署整套底层基础设施。全链路统一优化,最终实现模型更快、更稳定、成本更低,这套思路和苹果软硬一体的产品逻辑高度相似,通过全栈自研构筑差异化壁垒。

推理成本是当前 AI 商业化最大瓶颈,ChatGPT 各类订阅服务、代码生成功能,每一次交互都会持续消耗算力资源。

若 Jalapeño 能将单次推理能耗、延迟降低 30% 至 50%(谷歌 TPU 已验证该优化幅度具备可行性),OpenAI 将拥有极大商业灵活度:既能维持定价、拉高利润,也能降价扩容、抢占更多用户。官方重点提及实时编程模型成本优化,预示 Codex、GitHub Copilot 相关服务会成为芯片首批落地的核心业务负载。

短期无法替代训练算力,长期构筑算力护城河


Jalapeño 芯片将在2026年底正式发布,距离大规模量产尚有一段距离。

OpenAI 坦言,大模型预训练这类重型任务短期内依旧依赖英伟达硬件。因为芯片从实验室测试到全面规模化部署,普遍需要 1 至 2 年,叠加良率、散热、软件适配等多重工程难题,这款辣椒芯片预计 2027 至 2028 年会成为 OpenAI 推理集群主力。

但是即便未量产,Jalapeño 芯片的问世也释放明确行业信号:头部 AI 厂商正在向上游硬件延伸,算力芯片不再是单纯外购商品,自主定制硅片将成为企业不可复制的核心竞争壁垒,英伟达这一家独大的算力格局正在逐步被打破,硬件将无所谓的“护城河”。

作者:洛逸

评论

我要赞赏作者

请扫描二维码,使用微信支付哦。

分享到微信