“最近内存涨价实在太多。”10月24日,雷军在微博上带货某款手机时表示。
以三星电子为例,日前,其宣布内存芯片价格调涨60%,涨价直接冲击到了下游的消费电子厂商,带动包括手机,也包含笔记本、PC、平板等一系列设备的涨价。
内存涨价的直接原因是AI巨头们对HBM存储的需求,挤占DRAM颗粒产能。与此同时,推理需求的暴涨,也挤占了NAND闪存颗粒产能。
内存价格暴涨后,它们被赛博玩家们戏称为“电子茅台”、“电子黄金”。
涨价牵动着整个产业链的神经,中芯国际第三季度业绩会上,38次提及存储,联席CEO赵海军做了几个关键判断——目前供应缺口在5%以上,终端厂商短期有压力、扩产仍然在继续、对制造业是利好。
“无论是汽车、手机还是消费电子领域,使用存储器的终端厂商来年都将面临价格压力和供应保障问题,目前没有任何一方能给出明确的供应承诺。”赵海军说。
赵海军强调,供应缺口至少在5%以上,高价位将持续一段时间。“我曾做过分析,存储器市场若出现5%的供应缺口,价格可能翻倍;若供过于求5%,价格可能腰斩。”
那么,这一轮存储价格暴涨的逻辑链条是什么,或者说AI的需求如何传导至存储,让内存变成了“电子黄金”?
01 恐慌、囤货与价格倒挂
内存作为标准化产品,其行业发展直接受下游需求影响,呈现鲜明的周期性特征。
下游需求旺盛,行业进入上行周期,价格上涨,而下游需求一旦收缩,行业就进入了下行周期,价格就会下跌。
按赵海军的说法,在供需平衡状态下,出现正负5%的偏差,存储价格的对应翻倍或腰斩。
过去10多年,存储行业走过多轮交替起落的阶段:2012-2015、2015-2019、2020-2023,2024-至今,基本维持四年一个周期。单纯看时间,当前至少还处于上行阶段。
需要注意的是,前三个周期基本与智能手机有关,直到2024年起,大厂主动减产优化供给结构,叠加AI热潮拉动服务器、PC 端高端存储需求攀升,存储行业进入新一个周期的上行通道。
DDR技术路线图,来源:美光
2025年美光、三星等头部原厂相继宣布DDR4进入生命周期尾声——生产终止、销售收尾、支持缩减,在最后的采购期,原厂供货达成率远低于预期,动摇市场长期供应信心。
头部厂商本轮调整,核心是适配高端服务器需求,产能优先供给利润更高的HBM和DDR5,这种不可逆的产能迁移导致DDR4有效供给持续缩减。
需求端则呈现强韧性,北美互联网公司为控制成本、规避风险大量囤货,国内企业的AI服务器需求激增带动DDR4采购量增长,信创服务器因CPU产能紧张从DDR5退回DDR4,工控、网通、中低端手机等成本敏感产品因供应担忧提前备货。
原厂停产、渠道商控货、终端厂商抢货,DDR4价格反超DDR5,“价格倒挂” 现象出现。
尽管DDR5是未来趋势,但从DDR4切换过来需CPU、主板和操作系统等支持,短期无法改善供需错配现状。
一位存储行业从业者强调,这一轮涨价主要源自大厂停产引起的囤货恐慌,而非新增的消费需求,属于不健康的市场现象,不符合市场逻辑的性价比和商品属性。
“(涨价)至少要持续到明年,但市场情况变化很快,存储又周期性很强,要看具体情况。”该从业者说。
02 “迟来的”内存暴涨
前年提过,AI催生的刚性需求与行业供需结构的改变,同样推动着NAND闪存涨价。
过去NAND存储需求主要靠手机、电脑等消费电子产品拉动,增长平缓,且增长易受消费疲软影响,而AI推理的规模化落地,彻底改变这一局面。
推理需求规模上,OpenAI和Gemini的API日调用都接近10万亿 tokens,国内预估是这个数据两倍,甚至是三倍。
此外,智能客服、自动驾驶等场景需处理海量数据,对存储的容量、速度及随机I/O访问能力提出高要求,QLC eSSD这类NAND产品恰好完美适配这些需求。
8月下旬,华为也推出了基于SLC和3D TLC颗粒的AI SSD产品,当时还被称之为AI推理加速“黑科技”。
问题来了,AI行情都持续了这么久了,为什么现在才轮到存储暴涨?
DRAM,尤其是NAND的需求相对滞后,主要是需求处于积累期未形成规模化爆发,不代表技术无进展。
一方面,头两年AI技术多停留在模型训练与小规模验证阶段,互联网大 AI产品以探索、测试为主,业务渗透率相对较低,用户量与交互频次也有限,对存储的需求仅集中在HBM等高性能产品,未波及支撑海量数据分层存储的DRAM与NAND。
另一方面,AI对话以快思考为主,依赖自身知识库生成答案、token消耗低且无外部Agent协同,整体数据交互量也有限,难以拉动两类存储需求。
今年存储需求突然爆发,核心是AI业务迈入高渗透期:互联网大厂AI产品已成熟上线,业务渗透率提升大幅提升,支付、电商等传统互联网产品也在加速AI重构,带动用户交互频次显著增加。
SAP今年10月份的报告显示,目前中国企业平均28%的业务任务由AI提供支持,未来两年这一比例预计将升至44%。
另外,云计算厂商的三副本备份机制——把数据分割后,复制出3个完全相同的副本,再通过分布式算法将副本存储在集群中不同服务器的不同物理磁盘——也推动数据总量呈指数级增长,而这些数据需通过DRAM与NAND进行分层存储,直接拉动了两类产品的需求。
本轮涨价核心驱动力也包括是AI服务器需求超预期,云厂客户不仅锁定2025年第四季度产能,还提前下达2026年订单,导致供需快速失衡。
需要强调,本轮内存周期下DDR4产品库存与供需状态也与以往不同:目前供给端库存处于低位。
根据我们从产业了解到的数据,模组厂库存正常为4个月,目前只有2个月,而在供过于求时,模组厂库存可达10-12个月。
当然,HBM利润水平高达50%-70%,且产能消耗是标准型DRAM的3倍,原厂资本支出优先投向HBM,整个存储的供给结构已经改变。
03 涨价这柄双刃剑
这波存储涨价,哪些行业受影响比较明显?可以按存储刚需客户的内存需求占比作个排序。
下图是大摩统计的“内存在硬件厂商成本中的占比”,其中All-Flash Array Storage(全闪存阵列存储)位居首位,占比73%。
前面提到的手机产业,看似水深火热,但其实内存在整体成本中的占比只有18%,之所以各手机厂商都站出来发声,核心是手机市场的整体规模大,且更贴近于消费者。

内存供需失衡,与上游存储原厂控制利润率有关:哪类客户利润率高,就优先分配产能。
过去,手机这类客户可通过季度性优惠促销锁定70%-80%需求,现在存储厂商优先供给订单大、利润率高的AI服务器客户,手机厂商沦为配角。
本营国际的调研数据显示,国内一线品牌仅能锁定明年80%销量所需存储,二线厂商更是仅能锁定60%。
20%-40%的缺口,与随行就市的高价压力,以手机为代表的消费电子厂商,供应链能力将遭遇严苛考验。
所以,雷军这类手机大佬在线“诉苦”,也就不足为奇了。
短时间内,手机厂商可以通过库存平均价维持毛利,但随着库存消化,存储涨价带来的成本压力将逐步放大,叠加存储占整机BOM成本接近20%,利润偏薄的低端机型受冲击更明显,行业大者恒大的洗牌趋势也将进一步凸显。
除了消费电子品牌,硬件OEM/ODM行业也正面临存储超级周期带来的显著利润率压力。
生成式AI和数据激增等长期趋势支撑需求上涨,但NAND和DRAM价格在过去6个月分别上涨50%和300%,导致输入成本急剧上升。
大摩根据2016-2018周期历史经验,在11月初的硬件OEM行业报告中预测,2026年行业毛利率中位数下降60%,每股收益中位数低于比行业共识低了11%,并可能引发估值倍数收缩,戴尔、惠普、华硕等更是被大摩列为“最脆弱”的公司。
更宏观的来看,涨价对于产业也会带来负效应。
目前,DDR5已经成为国际产品的主流,英特尔、AMD等CPU头部企业的新一代平台也都已经完成导入。
集邦咨询2025年第一季度报告显示,全球服务器DRAM市场中,DDR5的出货占比已突破90%,成为AI训练、云计算等高算力场景的主要供给,这个时候因DDR4“价格倒挂”而扩产,可能会拖慢产业升级节奏。
“如果DRAM厂商看重短期DDR4价格倒挂带来的收益,而继续保持或扩大其产量,在产能为王的产业竞争格局中,意味着减少在DDR5等更高端产品上的投入,错失产品升级,进而丧失在DRAM高速迭代市场竞争中的抗衡能力。”前述存储行业从业者说。
04 存储的新故事过去几年,基于DRAM颗粒的HBM凭借高带宽赢得了AI芯片巨头们的青睐,但存储容量却是先天短板,于是开始闪迪等厂商提出基于NAND颗粒的HBF技术。
HBF借鉴了HBM的堆叠思路,将16层核心芯片堆叠并通过硅通孔互联,带宽可与HBM相匹配。
HBF架构剖面图,与GPU合封
闪迪强调称,成本接近的情况下,HBF芯片的容量却达HBM的8-16倍,单堆栈容量可达512GB,简单来说就是经济性更好。
另外,在当前计算架构下,接收数据的流程是SSD→ HBM→GPU,HBM同时负责计算内存和缓存网关的工作,进而形成了延迟瓶颈。
HBF与GPU直连提供数据,这会带来一系列连锁反应:token生成速度提升→GPU空闲时间减少→人工智能总拥有成本(TCO)降低 → 大型语言模型服务的单位成本下降。
经济性,低功耗、低延迟、高扩展性和实用性,进一步扩大了HBF的应用场景。
按应用场景看,HBF技术适合读取密集型AI推理任务,可用于手机端大模型本地化、自动驾驶等场景,闪迪计划2026年下半年交付样品,还联合SK海力士推进其技术标准化。
不过,这并不意味着HBF这种新的存储解决方案完美无瑕。
其一,DRAM颗粒没有生命周期限制,NAND存在寿命限制,一旦与GPU合封,其寿命耗尽也就意味着GPU板卡损坏,这对于一张价值数万美元的GPU来说,成本是无法接受的。
其二,NAND闪存对工作环境要求相对严格,在80-85摄氏度之间,而DRAM可以达到125摄氏度。
也就是说,未来行业有可能推动HBM+HBF的混合架构的落地,来大幅降低模型推理成本,其中HBF在与HBM的协同中,承担大容量辅助内存的角色。
虽然说HBM还不会被取代,但其需求增长的斜率预计将趋于平缓,对应DRAM颗粒的需求也会放缓,转而加大对NAND颗粒的依赖。