💡

文章摘要

2026 年,全球半导体市场迎来历史性拐点。WSTS 预测全年规模达 1.511 万亿美元(约 10.9 万亿元人民币),其中存储芯片同比暴增 249.5%,产值突破 8039 亿美元,成为拉动整个行业增长的核心引擎。本文从需求侧(AI 大模型、智能体、端侧 AI)、供给侧(三巨头垄断、HBM 产能挤占、DDR4 减产)、价格侧(DRAM/NAND 季度涨幅超 50%)三个维度,系统解读本轮存储超级周期的驱动逻辑、结构性矛盾和未来走向。

一、10.9 万亿元:一个数字背后的产业重构

2026 年 6 月,世界半导体贸易统计组织(WSTS)发布了最新行业预测:全球半导体市场规模将达到 1.511 万亿美元,折合人民币突破 10.9 万亿元。这不仅仅是又一个创新高的数字——它标志着半导体产业在 AI 算力需求的拉动下,完成了一次结构性的规模跃迁。

更令人瞩目的是增长结构:存储芯片全年市场营收同比暴涨 249.5%,产值突破 8039 亿美元,成为拉动半导体行业增长的绝对核心。相比之下,逻辑芯片同比增长 37.3%,模拟和分立器件稳步扩容,但增速远不及存储。

1.1 这不是周期性波动,是结构性跃迁

传统半导体行业有明显的「硅周期」——繁荣、过剩、衰退、复苏,周而复始。但 2026 年的数据打破了这一规律:

  • 存储芯片 249.5% 的增长,不是从低谷反弹,而是在 2024-2025 已经复苏的基础上再次爆发
  • 2027 年预计再增 26.6%,市场规模升至 1.914 万亿美元(约 12.9 万亿元),说明这不是短期脉冲
  • 增长的主力品类(HBM、DDR5、企业级 SSD)全部指向 AI 基础设施

这意味着 AI 对算力的需求已经从「拉动 GPU」扩展到「拉动整个存储产业链」。

图表加载中…

💡 一句话理解

理解本轮半导体增长的关键:不要只看总量,要看结构。存储芯片 249.5% 的增长说明 AI 的瓶颈正在从「算力不足」转向「数据喂不饱算力」——这是基础设施需求升级的信号。

⚠️ 常见踩坑

WSTS 的预测数据是行业共识而非精确值。实际结果受地缘政治(出口管制)、宏观经济(利率/汇率)、技术突破(新架构)等多因素影响,可能存在 ±10% 的偏差。

二、需求侧:AI 的三重存储压力

AI 对存储的需求不是单一维度的,而是三重压力同时叠加,每一层都在推高存储芯片的消耗量。

2.1 第一重:模型「装得下」——容量需求

当前主流 AI 大模型参数量已从千亿级迈向万亿级。一个万亿参数的模型,仅权重就需要约 2TB 存储空间(FP16 精度)。加上训练数据、检查点、梯度缓存,单次训练任务所需的存储容量可达 数十 TB

更关键的是,模型不是训练一次就结束。RLHFDPO、持续预训练对齐技术需要频繁保存和加载模型快照,进一步放大了存储需求。

2.2 第二重:数据「喂得上」——带宽需求

AI 推理过程中,GPU/NPU 处理器的算力远超内存供数速度,计算单元大部分时间在等待数据。 这就是所谓的「内存墙」问题。

以 NVIDIA H100 为例:

  • 算力:989 TFLOPS(FP16)
  • 内存带宽:3.35 TB/s(HBM3
  • 但实际利用率通常只有 30-50%,因为数据搬运速度跟不上计算速度

HBM高带宽内存)因此成为 AI 芯片的标配。英伟达、谷歌、微软等巨头已提前锁定 2026 年全年 HBM 产能。

2.3 第三重:端侧「铺得开」——泛在需求

从云端大模型到手机、汽车、物联网设备,端侧 AI 正在全面铺开:

  • AI 手机需要更大的运行内存(8GB→12GB→16GB 趋势)
  • 智能汽车的自动驾驶系统需要高可靠性的车规级存储
  • IoT 设备的边缘推理需要低功耗、高密度的存储方案

AI 服务器单台所需存储容量是传统服务器的 8-10 倍,这个乘数效应意味着:即使 AI 服务器数量只增长 30%,对存储的总需求也会增长 240-300%。

图表加载中…

💡 一句话理解

「内存墙」是理解本轮存储涨价的核心概念。GPU 算力再强,如果数据喂不上去,就是空转。HBM 的价值不在于「存得多」,而在于「送得快」——带宽比容量更关键。

⚠️ 常见踩坑

端侧 AI 的存储需求虽然总量不如云端,但增速极快且分散在多个品类,容易造成「全面缺货」的局面——这正是 2026 年正在发生的。

三、供给侧:三巨头的寡头博弈与产能错配

存储芯片市场是一个典型的寡头垄断市场。三星、SK 海力士、美光三家合计控制全球 90% 以上的存储产能。这种高度集中的市场结构,意味着供给端的任何战略调整都会对价格产生巨大影响。

3.1 产能大转移:从 DDR4 到 HBM

2023-2024 年的行业下行期给存储厂商造成了巨额亏损。痛定思痛后,三大厂商在 2025 年做出了一个激进的战略选择:大幅削减 DDR4 等普通存储产线,将超过 85% 的先进制程产能转向高毛利的 HBM 和 DDR5 产品

这个决策的逻辑很清晰:

  • HBM 的单价是普通 DRAM 的 5-10 倍
  • AI 客户愿意签长期协议、提前锁定产能
  • 利润率远高于消费级产品

但副作用是:传统消费级存储产能持续收缩,内存条、手机存储、消费级 SSD 等产品供应不足,现货资源紧缺直接推高了芯片报价。

3.2 库存降至四年低位

经过两年的产能调整和 AI 需求爆发,头部厂商的库存已降至近四年低位。在供给弹性有限的情况下(扩产需要晶圆厂、EUV 设备、先进封装等多个环节配合),2026 年 DRAM 和 NAND 的季度合约价多次出现 50% 以上的涨幅。

3.3 扩产周期 vs 需求增速

存储芯片的扩产周期通常需要 18-24 个月(从建厂到量产),而 AI 需求的增速是以季度为单位跳跃的。这种「时间差」是供需缺口持续扩大的根本原因。

即使三大厂商现在宣布扩产,新增产能最早也要到 2027 年下半年才能释放。而 WSTS 预测 2027 年存储市场还将再增 26.6%——供不应求的局面短期内难以扭转。

图表加载中…

💡 一句话理解

存储市场的寡头结构意味着:价格不是由「市场供需」自由决定的,而是由三巨头的产能分配策略主导。理解这一点,才能理解为什么涨价来得这么快、这么猛。

⚠️ 常见踩坑

产能转移不是零和博弈。HBM 的高利润确实让厂商赚得更多,但消费级存储的短缺会推高手机、PC、汽车等终端产品的成本,最终由消费者买单。

四、HBM:AI 存储的皇冠明珠

在所有存储品类中,HBMHigh Bandwidth Memory高带宽内存 是本轮超级周期中最耀眼的明星。它是解决「内存墙」问题的关键技术,也是三大厂商争夺最激烈的战场。

4.1 什么是 HBM

传统 DRAM 通过并行接口与 GPU 连接,带宽有限(GDDR6X 约 1 TB/s)。HBM 则采用3D 堆叠 + TSV(硅通孔)技术,将多层 DRAM 芯片垂直堆叠,通过数千个微小通道与 GPU 直接连接,实现超高带宽。

HBM3E 为例:

  • 单颗容量:36GB
  • 带宽:920 GB/s
  • 功耗效率:比 GDDR6X 高 2-3 倍

4.2 HBM 的市场格局

2026 年 HBM 市场呈现「三足鼎立」格局:

  • SK 海力士:市场份额约 50%,是 NVIDIA 的核心供应商
  • 三星:约 40%,正在追赶 HBM3E 良率
  • 美光:约 10%,专注差异化产品

三家合计控制 nearly 100% 的 HBM 产能。这意味着任何一家的产能波动都会影响全球 AI 芯片的交付

4.3 HBM 的供需矛盾

2026 年 HBM 的供需矛盾极其尖锐:

  • NVIDIA Blackwell 架构(B200/GB200)对 HBM3E 的需求是上代 H100 的 2.4 倍
  • 谷歌 TPU v6、AMD MI400 等也在争抢 HBM 产能
  • 三家厂商的 HBM 产能已被大客户提前锁定全年

结果就是:即使你是一家中型 AI 创业公司,想买到足够的 HBM 芯片也需要排队 6-12 个月。

图表加载中…

💡 一句话理解

HBM 的核心价值不是「容量大」,而是「带宽高」。AI 推理的瓶颈往往不是「装不下模型」,而是「数据送不到计算单元」。HBM 通过 3D 堆叠解决了这个带宽问题。

⚠️ 常见踩坑

HBM 的 3D 堆叠工艺极其复杂,良率是核心瓶颈。三星在 HBM3E 上的良率问题曾导致交付延迟,直接影响 NVIDIA 的 GPU 出货节奏。

五、未来展望:2027-2028 的存储格局

站在 2026 年中,我们可以对未来 18-24 个月的存储市场做出以下判断:

5.1 短期(2026 下半年):供需紧张持续

  • DRAM 合约价预计再涨 20-30%
  • NAND 价格跟随上涨,企业级 SSD 交货周期延长
  • HBM3E 仍是稀缺资源,Blackwell 架构 GPU 交货周期 36-52 周

5.2 中期(2027):新增产能释放

  • 三星、SK 海力士的新晶圆厂开始投产
  • HBM4 进入量产,单颗带宽突破 1.5 TB/s
  • 存储市场增速放缓至 26.6%(WSTS 预测),但仍处于高位

5.3 长期(2028+):技术变革期

  • CXL(Compute Express Link)内存池化:打破「每台服务器独立配置内存」的限制,实现跨服务器内存共享
  • 3D DRAM:不再依赖 TSV 堆叠,而是用全新的 3D 晶体管结构制造 DRAM,容量和带宽再翻倍
  • 存算一体(Processing-in-Memory):将计算单元直接嵌入存储芯片,从根本上解决「内存墙」

这些技术中,CXL 最接近商用(预计 2027 年规模部署),3D DRAM 次之(2028-2029),存算一体最远(2030+)。

核心判断:AI 对存储的需求不会减速,但供给端的技术创新正在加速追赶。2026 年的「超级周期」不是终点,而是 AI 基础设施需求爆发的新起点。

图表加载中…

💡 一句话理解

CXL 内存池化是未来 2 年最值得关注的存储技术。它允许数据中心将内存作为独立资源池分配,可能彻底改变 AI 基础设施的架构设计。

⚠️ 常见踩坑

技术预测的时间线往往过于乐观。3D DRAM 和存算一体在实验室已经存在多年,但从实验室到量产的距离可能比预期更长。投资和商业决策应留足缓冲。