米兰体彩app官方网站

热点资讯

你的位置:米兰体彩app官方网站 > 米兰滚球 >

米兰体彩app OpenAI 与 Cerebras 合作: 100 亿好意思元订单背后的算力现实

发布日期:2026-02-15 12:06    点击次数:187

米兰体彩app OpenAI 与 Cerebras 合作: 100 亿好意思元订单背后的算力现实

引子2026 年 2 月 13 日,OpenAI 进展上线基于 Cerebras 芯片的 GPT-5.3-Codex-Spark 模子,推理速率超 1000 tokens/秒。这是 OpenAI 初次在其主力居品中袭取非英伟达芯片,亦然 Cerebras 建造十余年来最大畛域的买卖落地。

两边于 2026 年 1 月签署 100 亿好意思元合作左券,要求 Cerebras 在 2028 年前提供 750 兆瓦算力——尽头于 60 万个好意思国度庭的年用电量。这笔往复揭示了 OpenAI 的算力压力,也败露了 Cerebras 对单一客户的依赖窘境。

一、已阐发事件:从左券签署到居品上线 枢纽时间线(官方阐发): 2026 年 1 月 14 日:OpenAI 晓示与 Cerebras 结束多年期左券,金额超 100 亿好意思元。2026 年 2 月 13 日:合作首款居品 GPT-5.3-Codex-Spark 上线,面向 ChatGPT Pro 用户盛开筹商预览。 居品定位:轻量高效版块,专为及时相助编程场景假想。 官方技能参数(来源:OpenAI + Cerebras):

狡计

数值

推理速率

>1000 tokens/秒

首 token 延长

280 毫秒

芯片型号

{jz:field.toptypename/}

Cerebras WSE-3(Wafer Scale Engine 3)

晶体管数目

4 万亿

AI 中枢数

90 万

片上 SRAM

44 GB

芯单方面积

46,225 mm²(约为圭臬 GPU 的 50 倍)

内存带宽

21 PB/秒

WSE-3 袭取“晶圆级”假想,将狡计单位与内存集成于单张硅片,排斥多芯片间数据搬运瓶颈。

OpenAI 狡计负责东谈主 Sachin Katti 透露:“Cerebras 在极低延长职责流方面阐明出色,让 Codex 在迭代中反馈更马上。”

二、OpenAI 为何遴荐 Cerebras?算力成本与供给双重承压这不是技能尝鲜,而是现实所迫。

财务压力真实存在2025 年前 9 个月,OpenAI 推理支拨达 86.7 亿好意思元,接近同期收入的两倍。CEO Sam Altman 承认:每月 200 好意思元的 ChatGPT Pro 订阅仍在亏欠。ChatGPT 周活用户已冲突 9 亿,每次查询王人在破钞腾贵算力。 英伟达供应仍不及尽管 2025 年 9 月 OpenAI 与英伟达着手 “星门狡计”(Stargate),开心部署 10 吉瓦数据中心(英伟达投资 1000 亿好意思元),但 GPU 录用仍无法知足需求。CFO Sarah Friar 明确透露:“狡计容量枯竭正在主动延长居品发布。” Cerebras 的实测上风在特定推理任务中,米兰体彩WSE-3 比英伟达 B200 快 5 倍,成本低 32%(Cerebras 官方测试数据)。对 Codex 这类需毫秒级反馈的编程助手,延长优化平直提拔用户体验。三、Cerebras 的动机:开脱对 G42 的严重依赖对 Cerebras 而言,OpenAI 订单的中枢价值在于客户多元化。

单一客户风险卓越2024 年上半年,阿联酋 G42 公司孝敬其 87% 的收入。这一高度辘集结构是 Cerebras 2024 年 10 月恐慌 IPO 央求的枢纽原因。 OpenAI 合作的战术真理真理初次获取 好意思国脉土超大畛域客户考证;100 亿好意思元订单提供 遥远收入可见性;为异日再行提交 IPO 提供 “质料背书”。Cerebras CEO Andrew Feldman 在融资文献中炫耀,公司正以 220 亿好意思元估值寻求召募 10 亿好意思元资金。OpenAI 合作权贵提拔了其老本商场招引力。

四、OpenAI 的“双轨”策略:并未铲除英伟达值得细心的是,OpenAI 并未放手英伟达生态,而是遴选并行基础关节策略:

轨谈

技能路子

枢纽信息 轨谈一:英伟达主导 “星门狡计”

- 得州阿比林数据中心已部分投运- 部署 64,000 块 GB200 GPU- 狡计总容量 7–10 吉瓦- 总投资超 4000 亿好意思元(含英伟达 1000 亿) 轨谈二:多元替代架构 Cerebras + AMD + 自研

- Cerebras 提供 750 兆瓦专用推理算力- 同期测试 AMD MI450- 与 Broadcom 合作开垦自研芯片

Sam Altman 强调:“整合 Cerebras 是为了让 AI 反馈更快。”枢纽词“组合”标明其明确的多元化定位。

五、行业影响:推理商场正在分化OpenAI 的遴荐印证了一个趋势:考试与推理的技能旅途正在别离。

刻下边幅(基于已公开事实):考试商场:英伟达 GPU + CUDA 生态一经事实圭臬,壁垒深厚;推理商场:对低延长、高能效的专用架构需求高涨。Cerebras 的上风在于:

将模子参数全载入 44GB 片上 SRAM,幸免 HBM 内存考察延长;与 Groq(获英伟达 200 亿好意思元非独家授权)、SambaNova(Intel 洽谈 16 亿好意思元收购)等共同推动推理专用芯片生态。但挑战雷同真实:

英伟达领有 20+ 年软件生态积贮;Cerebras 需从零构建用具链与开垦者社区;OpenAI 同期鼓动自研芯片,默示其不肯遥远绑定任何外部供应商。 数据来源(均为公开报谈或官方走漏)

TechCrunch(2026-02-13):GPT-5.3-Codex-Spark 发布慑服

Cerebras 官方文档:WSE-3 技能规格

{jz:field.toptypename/}

The Next Platform(2026-01-26):100 亿好意思元左券条件

Programming Helper(2026-01-25):OpenAI 财务与基础关节数据

Benzinga / TipRanks(2026-01-14):Cerebras 客户辘集度分析

CNBC / Reuters(2025-09-23):“星门狡计”进展

Wain Tokyo(2025-08-28):WSE-3 架构明白

互动照应你是否体验过 GPT-5.3-Codex-Spark?280 毫秒延长是否昭着改善编程体验?在试验开垦中,“反馈速率”和“代码质料”,哪个对你更首要?OpenAI 同期押注英伟达与 Cerebras,是理智的风险散播,如故会导致架构碎屑化?100 亿好意思元订单能否真实帮 Cerebras 开脱 G42 依赖?如故仅仅把风险从一个客户转动到另一个?要是你是 AI 创业公司首创东谈主,在 GPU 供应弥留且腾贵时,你会选 Cerebras、AMD MI 系列,如故等自研芯片?#OpenAI战术养息##算力供应链##AI推理优化##大模子成本#



我的网站