深入了解 HBF:SanDisk 的高带宽闪存如何将大语言模型直接加载到硬件上
核心要点
- 高带宽闪存(HBF)是 SanDisk 和 SK 海力士共同开发的一种新型内存层级,旨在位于高带宽内存(HBM)和传统 SSD 存储之间,以解决 AI 的“内存容量墙”问题。
- HBF 的目标是提供与 HBM 相当的带宽,同时以相似的成本提供 8-16 倍的存储容量,使 AI 加速器能够容纳更多可直接被芯片访问的模型参数和上下文数据。
- 该技术于 2026 年 2 月 25 日在加利福尼亚州米尔皮塔斯举行的联合发布会上正式亮相,并同时通过开放计算项目(Open Compute Project)推动全球标准化。
- HBF 基于 SanDisk 现有的 BiCS NAND 和 CBA(CMOS 键合阵列)技术构建,第一代产品已在送样阶段,第二代和第三代路线图预计读取带宽将分别超过 2 TB/s 和 3.2 TB/s。
- 客户送样目标定于 2026 年,首批 AI 硬件预计最早将于 2027 年集成 HBF,这使其成为一项具有前瞻性但尚未商业化交付的技术。
- 分析师普遍认为 HBF 是 SanDisk 2026 年股价大幅上涨的结构性原因之一,因为它可能开启一个多年期的 AI 推理内存市场,而 NVIDIA 和竞争对手也在竞相通过各自的方法来解决这一问题。
如果您一直在关注 SanDisk 2026 年非凡的股价表现,并不断看到 HBF 被提及为背后的原因,本文将准确解释什么是高带宽闪存,它的技术原理是什么,为什么它对大语言模型推理尤为重要,以及该技术目前的实际地位与仅处于路线图阶段的区别。简而言之,HBF 是一种新型内存架构,它结合了 NAND 闪存的高存储密度和接近 HBM(目前用于 NVIDIA 和 AMD AI 加速器的超高速内存)的带宽性能。其目标是让 AI 芯片能够将更多的模型权重和推理上下文数据保持在靠近处理器的位置,减少导致当今大型语言模型推理过程中出现“延迟”的缓慢且昂贵的外部存储访问。SanDisk 和 SK 海力士于 2025 年联合宣布了 HBF 和标准化工作,并于 2026 年 2 月通过正式发布会加速了推广。虽然其底层工程确实具有创新性并获得了行业认可,但必须将该技术的真实近期状态(送样、原型、早期路线图)与关于尚不存在产品的投机性声明区分开来。
如果您正在追踪像 HBF 这样的突破性技术如何重塑 AI 基础设施股票,并希望通过实时市场数据采取行动,您可以通过 WEEX 创建免费账户:https://www.weex.com/zh-CN/register?vipCode=vrmi 并探索其交易工具。
什么是高带宽闪存 (HBF)?通俗解释
要理解 HBF,首先需要了解它试图解决的内存层级问题。像 GPU 这样的 AI 加速器依赖于分层内存系统:超快但昂贵且容量有限的高带宽内存 (HBM) 位于最靠近芯片的位置,而较慢但容量大得多且便宜的 SSD 存储则位于更远的位置。随着大语言模型的增长,特别是当它们的上下文窗口扩展到百万 token 级别时,这些模型在推理过程中需要保持在“靠近”处理器位置的数据量呈爆炸式增长。当这些数据无法装入 HBM 时,系统要么必须重新计算(缓慢且昂贵),要么必须从慢得多的存储层获取,这会导致用户在 AI 应用负载较重时注意到的延迟和瓶颈。
HBF 被设计为介于这两个极端之间的新层级。HBF 由 SanDisk 现有的 BiCS 3D NAND 闪存技术构建,而非 HBM 中使用的 DRAM,其工程设计旨在提供与 HBM 相同范围的带宽,同时以相当的成本提供约 8 到 16 倍的存储容量。实际上,它使芯片能够将更多的模型参数和键值缓存数据物理地保持在手边,解决了工程师所说的 AI“内存容量墙”问题,即模型不再受限于原始计算能力,而是受限于能够保持随时可访问的相关数据量。
| 内存层级 | 技术基础 | 相对带宽 | 相对容量 | 典型角色 |
|---|---|---|---|---|
| HBM (高带宽内存) | DRAM | 最高 | 三者中最低 | 活动模型权重,实时计算 |
| HBF (高带宽闪存) | NAND 闪存 (BiCS/CBA) | 与 HBM 相当 (目标) | 8-16x HBM 容量 | 推理上下文,大型参数集 |
| 传统 SSD | NAND 闪存 | 最低 | 最高 | 批量存储,冷数据 |
为什么 HBF 对将大语言模型直接加载到硬件上至关重要
“将大语言模型直接加载到硬件上”这句话很好地捕捉了 HBF 的核心承诺。由于 HBF 可以在提供接近 HBM 带宽的同时容纳更大容量的数据,因此将大语言模型的更多参数或其在长上下文推理过程中不断增长的键值缓存保留在快速内存中,而不是不断地在远端存储之间来回传输数据,变得切实可行。根据引用 SanDisk HBF 堆栈的架构研究,单个提供 512 GB 参数存储和约 1.2 TB/s 带宽的 HBF 配置,可以支持大型混合专家模型和推理模型的实时推理,达到有意义的 token 生成速度,研究人员将其性能水平与通常与机架级 GPU 集群相关的性能水平进行了比较,但其占地面积要小得多。
这一点很重要,因为目前行业在 Transformer 推理中受内存限制的瓶颈主要不在于原始计算,而在于系统花费多少时间从内存获取数据而不是进行计算。正如该技术的一位顾问、参与最初 HBM 开发的 KAIST 教授所解释的那样,Transformer 模型的推理工作负载花费在移动数据上的时间比计算的时间更多。HBF 通过拓宽更大、更便宜的内存池的带宽,直接针对该数据移动瓶颈。
HBF 时间表:从公告到标准化
HBF 的开发经历了几个具体的、可验证的里程碑,而不是仅仅停留在概念上,这也是它受到半导体行业和股票分析师认真对待的原因之一。
| 日期 | 里程碑 |
|---|---|
| 2025 年 (年中) | SanDisk 在投资者活动上首次亮相 HBF 概念;在 2025 年闪存峰会上获得“最佳展示奖”和“最具创新技术奖” |
| 2025 年 8 月 6 日 | SanDisk 和 SK 海力士签署谅解备忘录,共同标准化 HBF 规范 |
| 2025 年末 | 成立技术咨询委员会;跨 NAND 设计、ASIC 设计和封装的工程团队继续进行多年开发 |
| 2026 年 2 月 25 日 | SanDisk 和 SK 海力士在加利福尼亚州米尔皮塔斯举行联合发布会,正式揭幕 HBF,并通过开放计算项目启动全球标准化工作流 |
| 2026 年下半年 | 目标向特定客户发布样品模块 |
| 2027 年初 | 根据行业报告,首批 AI 硬件产品预计将集成 HBF |
此时间表显示 HBF 目前处于送样和标准化阶段,尚未在商业 AI 硬件中发货。对于任何评估暗示该技术已在当今生产系统中“消除延迟”的标题的人来说,这种区别很重要;截至 2026 年年中,HBF 仍然是一项由工作原型和严肃的行业合作伙伴关系支持的近期路线图技术,而不是一种广泛部署的产品。
HBF 技术路线图:性能代际
SanDisk 已经发布了基于其 CMOS 键合阵列 (CBA) NAND 基础的 HBF 多代前瞻性性能目标。
| 代际 | 目标读取带宽 | 目标堆栈容量 | 功耗效率 (对比第一代) |
|---|---|---|---|
| 第一代 | 初始送样阶段带宽 | 初始容量层级 | 基准 |
| 第二代 | 超过 2 TB/s | 最高 1 TB | 约 0.8x 功耗 |
| 第三代 | 超过 3.2 TB/s | 最高 1.5 TB | 约 0.64x 功耗 |
SanDisk 将此路线图定位为其最具可扩展性的半导体平台之一,并认为与面临日益严峻的物理缩放挑战的 DRAM 不同,HBF 受益于 NAND 通过 SanDisk 的 BiCS 架构实现的更有利的密度缩放路径。这些代际目标是否能按计划实现,将是分析师在未来两到三年内观察到的更清晰的技术信号之一。
HBF 如何与 NVIDIA 的竞争方法进行比较
SanDisk 和 SK 海力士并不是唯一解决 AI 内存容量墙问题的参与者。NVIDIA 作为 HBM 的主要买家,通过所谓的推理上下文内存存储平台 (ICMSP) 寻求自己的答案,该平台使用 DPU 连接的 NVMe SSD(专门绑定到 NVIDIA 的 BlueField-4 数据处理单元),以容纳从 HBM 和 GPU 服务器 DRAM 中溢出的键值缓存数据。这种方法通过使用光子学的高速以太网网络连接到 NVIDIA Vera Rubin 平台中的 GPU,每个端口运行速度为 800 Gbps。
| 方法 | 公司 | 核心方法 | 状态 |
|---|---|---|---|
| HBF (高带宽闪存) | SanDisk, SK 海力士 | 模仿 HBM 带宽配置的基于 NAND 的内存封装 | 2026 年送样,标准化进行中 |
| ICMSP | NVIDIA | 通过高速以太网联网的 DPU 连接 NVMe SSD | 集成到 NVIDIA 的 Vera Rubin 平台中 |
| PBSSD | 三星 | 基于闪存的 AI 存储层级 | 开发中 |
值得注意的是,NVIDIA 尚未公开表示有兴趣采用 HBF 本身,而是开发了自己的联网存储层解决方案。这对投资者和技术人员都很重要,因为它标志着至少有两种竞争性的架构哲学来解决同一个潜在问题:一种 (HBF) 将闪存直接集成到靠近计算芯片的类似内存的封装中,而另一种 (ICMSP) 则依赖高速网络将外部闪存存储连接到 GPU。哪种方法或方法的组合成为行业标准,可能会在未来几年内塑造对 NAND 与网络和 DPU 硬件的需求模式。
为什么 HBF 与 SanDisk 的股票故事相关
当分析师讨论 SanDisk 2026 年戏剧性的股价表现时,HBF 已成为反复出现的技术解释之一。逻辑联系了三件事:AI 推理工作负载越来越受到内存容量的限制,而不是纯粹受限于计算;HBF 通过基于 NAND 的解决方案直接针对该限制,发挥了 SanDisk 的核心制造优势;SanDisk 现有的 NAND 业务已经受益于一个独立的、更直接的 AI 驱动的企业级 SSD 需求周期。总之,这些创造了一个叙事,即 SanDisk 不仅仅是在乘着近期的 NAND 定价周期,而且可能处于 AI 硬件构建方式长期架构转变的中心,前提是 HBF 获得广泛的行业采用。
清楚地认识这两个故事之间的区别是值得的。SanDisk 股价在 2026 年上半年的飙升主要是由当前的企业级 SSD 需求和 NAND 合约定价驱动的,这是一个真实且已经货币化的趋势。相比之下,HBF 是一个仍处于送样和标准化阶段的未来收入机会,预计最早要到 2027 年才能实现商业硬件集成。一些市场分析师预计,随着 AI 推理工作负载在全行业范围内进一步扩展,有意义的 HBF 相关需求加速增长可能要到 2030 年左右才会出现。投资者和交易者应将 HBF 视为叠加在 SanDisk 近期、已证实的 NAND 定价故事之上的长期可选性因素,而不是当前的收入驱动因素。
HBF 的风险和悬而未决的问题
在 HBF 成为 AI 基础设施的主流组件之前,仍存在几个真正的不确定性。通过开放计算项目的标准化需要时间,并且需要除 SanDisk 和 SK 海力士之外的广泛行业支持;如果没有来自 GPU 制造商和系统集成商的更广泛采用,HBF 有可能仍然是一个利基解决方案。鉴于 NVIDIA 在 AI 加速器设计中的主导地位,其对 HBF 缺乏公开承诺是一个有意义的悬而未决的问题,因为其自身的 ICMSP 方法代表了一种竞争架构,可以通过不同的技术路径捕获相同的市场机会。制造复杂性也不容小觑;HBF 结合了先进的 3D NAND 堆叠、新型封装和晶圆键合技术,需要可靠地扩展到大批量生产,据报道,工程团队即使在公开亮相之前,也已经为此工作了近两年。最后,像任何新兴的半导体技术一样,在大规模生产中实现的实际性能、良率和成本数字可能与 SanDisk 发布的代际路线图目标有所不同。
结语
HBF 代表了一种真正新颖的方法,旨在解决 AI 基础设施最紧迫的技术瓶颈之一:如何将足够的相关数据保持在足够靠近处理器的位置,以避免当前内存容量限制所造成的延迟。通过将 NAND 闪存的高密度与接近 HBM 的带宽性能相结合,SanDisk 和 SK 海力士正在瞄准一个随着语言模型扩展到更长的上下文窗口和更复杂的推理工作负载而变得越来越紧迫的问题。该技术在不到两年的时间内从概念发展到工作原型,再到具有真正标准化动力的正式联合发布,这在半导体行业标准中是一个快速的步伐。话虽如此,截至 2026 年年中,HBF 仍处于商业化前阶段,客户送样目标定于今年晚些时候,首批集成 AI 硬件预计要到 2027 年才会出现。对于任何评估 SanDisk 更广泛的 AI 存储故事的人来说,HBF 最好被理解为叠加在公司已经证实、目前正在货币化的 NAND 和企业级 SSD 业务之上的一个可信、资源充足的长期赌注。
如果这种对驱动 AI 基础设施股票的技术的深入研究对您有用,您可以通过 WEEX 注册并探索其交易平台,将该研究付诸实践:https://www.weex.com/zh-CN/register?vipCode=vrmi
常见问题解答
1. 什么是高带宽闪存 (HBF),它与 HBM 有何不同?
HBF 是一种基于 NAND 闪存而非 DRAM 的新型内存技术,旨在提供与高带宽内存 (HBM) 相当的带宽,同时以相似的成本提供 8 到 16 倍的存储容量。HBM 仍然更快且延迟更低,但 HBF 允许 AI 系统保持更多的数据(如模型参数或推理上下文),而无需纯 DRAM 内存的成本和容量限制。
2. HBF 何时会在真正的 AI 硬件产品中可用?
截至 2026 年年中,HBF 处于送样和标准化阶段。根据行业报告,样品模块目标在 2026 年下半年发布给特定客户,首批集成 HBF 的 AI 硬件产品预计从 2027 年初开始。
3. HBF 会取代 NVIDIA GPU 等 AI 芯片中的 HBM 吗?
不会。HBF 旨在补充 HBM,而不是取代它。它旨在充当额外的内存层级,位于超快的 HBM 和传统的、慢得多的 SSD 存储之间,处理不需要 HBM 绝对最快速度但仍需要比标准存储好得多的性能的大容量数据(如推理上下文)。
4. 哪些公司正在开发 HBF 技术?
SanDisk 和 SK 海力士正在联合开发 HBF,并于 2025 年 8 月签署了谅解备忘录以标准化其规范。他们于 2026 年 2 月在联合活动中正式推出了该技术,并正在与开放计算项目合作进行全行业标准化,而 NVIDIA 和三星等竞争对手正在追求各自解决相同内存瓶颈的替代方法。
5. HBF 如何与 SanDisk 2026 年的股价飙升联系起来?
分析师将 HBF 视为叠加在 SanDisk 更直接的 AI 驱动的企业级 SSD 和 NAND 定价故事之上的长期、前瞻性增长驱动力,这是该股飙升的主要近期因素。HBF 代表了与潜在的新 AI 内存架构市场相关的未来可选性,而不是当前的收入来源,因为预计在 2027 年之前不会有商业产品。
免责声明
本文仅供参考和教育目的,不构成财务、投资、法律或技术建议。关于 HBF 技术、产品时间表和公司声明的信息反映了截至 2026 年中期的公开数据,并可能随着技术的发展而变化;商业可用性、性能规格和采用时间表可能与当前路线图有重大差异。对 SanDisk 股票表现的引用仅供说明,不构成买卖任何证券的建议。在做出任何投资决定之前,请务必进行自己的独立研究并咨询持牌财务顾问。作者和出版商均不对因依赖此内容而导致的任何损失负责。




