中国证监会认证证券投资咨询机构(证书编号:ZX0118) | 客服电话:400-636-8688 | 投诉电话:0755-33189899

【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期

【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期 1

 

当AI算力迈入“PFLOPS时代”,存储体系的革新已成为决定算力释放效率的关键变量。英伟达新一代Vera Rubin平台的横空出世,不仅将单卡推理/训练性能推向新高度,更重构了HBM-DRAM-NAND三层存储金字塔格局。其中,长期被视为“辅助存储”的NAND Flash,首次成为支撑AI超长上下文处理的核心力量,地位实现质的跃升。

 

一、NAND Flash:非易失性存储核心,数字时代的“数据粮仓”

 

NAND Flash(NAND型闪存)是一种基于浮栅晶体管技术的非易失性存储器,核心优势在于断电后数据可长期保存,同时具备高密度、低功耗、读写速度快等特性,已成为现代数字设备与数据中心不可或缺的核心存储组件。要理解其在AI时代的价值,需先从技术原理、产品分类与应用场景三大核心维度拆解。

 

1. 技术原理:浮栅储电荷,实现数据长期留存

 

NAND Flash的核心是浮栅晶体管结构,与普通MOSFET晶体管相比,其在控制栅与沟道之间嵌入了一层被绝缘层完全包围的浮置栅极。这一浮栅与周围电气隔离,注入的电子可被长期“困住”,从而实现数据的非易失性存储。电子发烧友网2025年发布的技术解析指出,NAND Flash的数据存储基于电荷状态差异:擦除状态下浮栅无电子,晶体管导通对应逻辑“1”;编程状态下电子通过FN隧穿效应注入浮栅,晶体管阈值电压升高,标准读电压下无法导通对应逻辑“0”。

 

从操作模式来看,NAND Flash的擦除以“块”为单位,写入以“页”为单位,读取则可支持页级或更小单位操作。这种操作特性决定了其更适合大规模数据的顺序读写,同时需要通过控制器实现FTL(闪存转换层)、磨损均衡、纠错码等管理功能,以弥补擦写次数限制、读干扰等物理特性带来的短板。

 

【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期 2

 

2. 产品分类:按存储密度划分,适配多元需求

 

根据单个浮栅单元可存储的比特数,NAND Flash可分为SLC、MLC、TLC、QLC四大类,不同类型在性能、寿命与成本上形成显著差异,适配不同应用场景。其中,SLC(单层单元)每单元存储1bit,速度快、寿命长(擦写次数可达10万次以上)但成本最高,主要用于工业控制、企业级存储等对可靠性要求极高的场景;MLC(双层单元)每单元存储2bit,性能与寿命居中,曾广泛应用于中高端固态硬盘;TLC(三层单元)每单元存储3bit,容量密度提升,成本显著降低,是当前消费级固态硬盘与嵌入式存储的主流选择;QLC(四层单元)每单元存储4bit,容量最大、成本最低,但速度与寿命最弱(擦写次数约1000次),主要用于大容量数据冷存储场景。

 

从技术演进来看,平面NAND已接近物理微缩极限,3D NAND成为行业主流方向。3D NAND通过将晶体管阵列垂直堆叠,像“建摩天大楼”一样提升存储密度,同时有效改善了平面NAND的性能与可靠性问题。目前主流3D NAND堆叠层数已突破200层,三星、铠侠、长江存储等头部企业均已实现规模化量产,为NAND Flash在大数据、AI等领域的应用奠定了基础。

 

3. 应用场景:从消费电子到数据中心,全面渗透数字生活

 

凭借非易失性与高密度优势,NAND Flash的应用场景已全面覆盖消费电子、工业控制、数据中心等核心领域。在消费电子领域,智能手机的嵌入式存储(eMMC/UFS)、笔记本电脑与台式机的固态硬盘(SSD)、U盘、存储卡等,均以NAND Flash为核心存储介质;在工业与汽车领域,工业控制设备、车载信息娱乐系统、自动驾驶数据存储等场景,对NAND Flash的可靠性与耐温性提出更高要求,工业级TLC/MLC产品成为主流;在数据中心领域,全闪存阵列(AFA)、AI服务器缓存、冷数据存储等场景,对NAND Flash的容量、读写带宽与延迟提出极致要求,企业级SSD与高耐用性3D NAND产品需求持续增长。

 

二、Rubin平台革新:NAND Flash跃升核心,重构AI存储金字塔

 

英伟达Vera Rubin NVL72平台的核心增量技术为NVFP4,将单卡推理/训练性能分别提升至50 PFLOPS、35 PFLOPS,约为上一代Blackwell平台的5倍、3.5倍。要支撑这一级别的超高算力,英伟达对存储体系进行了颠覆性重构,HBM-DRAM-NAND三层存储金字塔的容量比例、带宽瓶颈与价值量结构均发生根本性变化。其中,NAND Flash从传统的“冷存储”角色,跃升为承接AI海量“长期记忆”(长上下文)的核心层,成为AI实现超长对话能力的关键支撑。

 

1. 存储金字塔重构逻辑:适配超高算力的分层数据管理

 

AI算力的提升不仅依赖芯片性能,更需要存储体系对数据的高效吞吐与分层管理。在Rubin平台之前,AI服务器的存储体系以HBM(高速缓存)与DRAM(主内存)为主,NAND Flash仅作为辅助的冷存储介质。而随着AI模型参数规模扩大与长上下文需求提升,传统存储体系已无法满足海量数据的实时调用需求。

 

英伟达在Rubin平台中重构的三层存储金字塔,实现了数据的“热冷分层”精准管理:HBM4作为与GPU紧密绑定的“计算核心”,负责存储实时运算的最热数据;DRAM(LPDDR5X)作为“中等热度”数据存储层,负责存放KV Cache等需要快速调用的数据;NAND Flash则作为“长期记忆”存储层,承接海量长上下文数据,三者协同实现算力的最大化释放。这种重构不仅解决了存储带宽瓶颈,更让NAND Flash的价值量实现量级提升,成为与GPU数量线性相关的“通胀品”。

 

图:Vera Rubin NVL144 CPX

 

【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期 3

资料来源:华尔街见闻,英伟达,甬兴证券研究所

 

2. NAND Flash的技术适配:BlueField-4 DPU赋能,低延迟衔接算力核心

 

为让NAND Flash更好适配AI算力需求,英伟达通过BlueField-4 DPU(数据处理单元)为每颗Rubin GPU新增16TB NAND构建KV Cache/上下文存储层,实现了NAND与GPU的高效直连。从技术架构来看,每个Vera Rubin NVL72机架配备4个BlueField-4 DPU,这些DPU共同管理150TB上下文内存池,并通过机架内高速网络与所有GPU直连,为每颗GPU分配16TB专用上下文空间。

 

这种架构设计带来两大核心优势:一是容量大幅提升,与上一代平台相比,每个Rubin机架新增NAND容量达1152TB(72颗GPU×16TB),彻底解决了AI长上下文处理的存储容量瓶颈;二是延迟显著降低,通过DPU的硬件加速与直连架构,NAND存储层的访问延迟大幅下降,网络压力显著缓解,确保海量长上下文数据能够快速响应GPU的运算需求。从应用价值来看,NAND Flash的这一革新让AI模型能够处理更长的对话序列与更海量的输入数据,大幅提升了AI应用的实用性与场景适配能力。

 

3. 三层存储的协同效应:全链路提速,支撑算力极致释放

 

Rubin平台的三层存储金字塔并非孤立存在,而是通过技术协同实现全链路提速。在HBM4层面,每颗Rubin GPU配备8栈HBM4,容量达288GB,带宽22TB/s,不再是传统的“高速缓存”,而是成为整个系统吞吐的硬约束,为实时运算提供极致高速的数据支撑;在DRAM层面,Vera CPU采用1.5TB级LPDDR5X SOCAMM,带宽1.2TB/s,是上一代Grace CPU的3倍,每个NVL72机架连接36颗Vera CPU,系统内LPDDR5X总容量达54TB,较上一代GB200/GB300平台提升2.5~3.0倍,为中等热度数据提供高效缓存;在NAND层面,150TB上下文内存池为长上下文数据提供稳定存储,三者通过智能调度算法实现数据的无缝流转,确保算力能够持续稳定释放。

 

三、Rubin平台引领增长,NAND存储需求迎来爆发期

 

作为英伟达面向下一代AI算力的核心平台,Rubin平台的市场规模将随AI算力需求的爆发持续增长,而其对NAND Flash的极致需求,或将直接带动相关存储芯片市场的扩容。

 

【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期 4

资料来源:wind,浙商证券研究所

 

1. Rubin平台市场规模:AI算力需求驱动,出货量快速攀升

 

当前全球AI算力需求仍处于爆发式增长阶段,OpenAI、谷歌、字节跳动等科技巨头持续加大AI大模型研发与算力投入,数据中心AI服务器采购需求旺盛。根据IDC发布的《全球人工智能基础设施市场半年度跟踪报告》预测,2025年全球AI服务器市场规模将达1150亿美元,2023-2025年复合增长率达38.4%;而随着Rubin平台的量产落地,其作为新一代高算力AI服务器的核心核心组件,有望快速抢占高端市场份额。

 

从产业进度来看,相关供应链企业或已进入备货阶段。中信证券在《半导体行业2026年投资策略》中预测,2026年Rubin平台相关GPU出货量有望突破100万颗,带动NVL72机架出货量达1.38万台以上;到2027年,Rubin平台GPU出货量有望进一步增长至250万颗,对应机架出货量超3万台。随着出货量的快速攀升,Rubin平台对NAND Flash、HBM、DRAM等存储芯片的需求将持续放量。

 

2. NAND Flash需求测算:单机架新增1152TB,市场空间显著扩容

 

按照Rubin平台的架构设计,每个NVL72机架新增NAND容量达1152TB,结合机构对Rubin机架出货量的预测,可测算出其带动的NAND Flash增量需求。以中信证券预测的2026年1.38万台机架出货量计算,仅Rubin平台就将带动NAND Flash增量需求达1590PB(1.38万台×1152TB/台);2027年3万台机架出货量则将带动NAND Flash增量需求达3456PB。

 

这一需求或将直接推动NAND Flash市场供需格局的改善。根据集邦咨询(TrendForce)发布的《2026年全球NAND Flash市场展望》,2025年全球NAND Flash市场总容量约为180EB,Rubin平台2026年带来的1590PB增量需求占比约0.88%,且将持续提升。更重要的是,Rubin平台采用的NAND Flash以企业级高耐用性产品为主,单价显著高于消费级产品,将进一步提升NAND Flash市场的整体价值量。邦咨询同时预测,受AI服务器需求拉动等因素影响,2026年全年NAND Flash价格将实现两位数百分比的持续上涨,行业景气度有望持续提升。

 

3. 产业链传导效应:从NAND芯片到模组,全链路业务发展或受益

 

Rubin平台对NAND Flash的需求增长,将形成从上游芯片制造到中游模组封装、下游服务器存储的全产业链传导效应。上游芯片制造环节,三星、铠侠、长江存储、美光等NAND Flash原厂或将直接受益于需求增长与价格上涨,企业营收与毛利率有望得到显著改善;中游模组封装环节,金士顿、威刚、群联电子、江波龙等企业,负责将NAND芯片封装为SSD等模组产品,或将直接承接Rubin平台的配套订单;下游存储方案环节,浪潮信息、戴尔、惠普等服务器厂商,或需根据Rubin平台的架构需求定制存储方案,相关存储配套业务发展或将迎来增长机遇。

 

英伟达Rubin平台的技术革新,让NAND Flash从传统辅助存储跃升为AI算力的核心支撑,或将开启存储芯片行业的新一轮景气周期。在AI算力需求持续爆发的推动下,Rubin平台市场规模将快速增长,带动NAND Flash需求放量与价格上涨,为存储芯片板块带来机遇

【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期 5

 

上述观点策略及分析结果仅供参考,不作为投资依据;涉及任何个股只做案例分享,不做任何推荐,据此操作风险自担。股市有风险,投资需谨慎。

 

以上观点由投顾服务部提供,投资顾问:常建武,登记编号:A1050619080001

【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期 6

未经允许不得转载:财富在线 » 【探秘】炸裂!英伟达Rubin重构AI存储,NAND或步入通胀周期

赞 (0)

评论 0

评论前必须登录!

登陆 注册