• 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

西部数据与希捷:存储双雄乘着AI最被低估的瓶颈

2026-06-30 18:19:59
收藏

为什么AI持续吞噬更多预算,却仍屡屡碰壁?

如果你对此感到困惑,不妨暂时把目光从GPU上移开。真正的瓶颈在于存储——那些用于训练数据投喂、保存检查点、存储嵌入向量以及归档推理日志的TB级乃至EB级数据。而在这个领域,西部数据和希捷正悄然占据核心地位。

本文将解析为何机械硬盘再度流行,价格与供应如何变化,以及这两大供应商在AI最不起眼的瓶颈环节中有何不同。没有炒作,只有真正重要的信号和人们常忽略的风险。

快速摘要

西部数据和希捷是近线硬盘(HDD)的核心供应商——这些硬盘以低廉的每TB成本,成为AI数据湖背后的主力。现场调查显示,由于超大规模云服务商通过长期协议锁定产能,未来数年将出现供应短缺,从而将定价权推向硬盘制造商。短期内,两家公司都受益于供应紧张;中期来看,需关注新技术产能爬坡速度,以及SSD价格是否大幅下滑从而抑制HDD的涨幅。

调查显示,HDD短缺可能持续至2028年,需求同比增长约40-50%,而供应增长仅约30-35%。供应商的目标是将当前每TB低于15美元的价格,在未来2-3年内提升至约25-30美元。西部数据表示,其2026年全部HDD产能已通过多年协议售罄,协议覆盖至2028-2029年。希捷的年制造规模约为550 EB,但需求仍超出可用供应。

为何存储成为2026年AI的真正瓶颈?

训练固然引人注目,但数据引力是无情的。基础模型如今从海量的非结构化数据中汲取信息。除了原始数据,还有中间产物:预处理后的分片、模型检查点、评估集、安全日志、用于检索的嵌入向量,以及长期留存策略所需的数据。再乘以全球区域和合规镜像,归档数据规模远超阵列容量,增长速度极快。

SSD在热数据路径上表现出色,但仅用闪存填充多EB级的数据湖,预算和功耗都难以承受。近线HDD在此处发挥作用。它们虽然速度较慢,但每TB成本和每TB功耗的计算结果仍然更青睐机械硬盘,尤其是在冷数据和温数据分层中。超大规模云服务商通常用SSD处理热工作集,而将HDD作为底层的持久基石。

正因如此,AI基础设施中看似平淡的部分——装满3.5英寸机械硬盘的机架——再度变得具有战略意义。如果无法快速扩展存储,就会限制工作负载或削减数据保留时间。当模型质量和可审计性依赖于数据规模和溯源时,这两种情况都不理想。

西部数据和希捷究竟向AI建设销售什么?

近线硬盘:3.5英寸企业级大容量单元,通常为20-30TB级别,专为高密度机柜中的全天候运行而设计。它们针对顺序吞吐量和耐久性进行了优化,而非追求炫目的IOPS。西部数据和希捷都销售完整的产品系列,以及配套的固件、振动控制和针对多盘位的数据路径优化。

在技术路径上,两家公司有所不同,以不断提升面密度。希捷一直主推HAMR(热辅助磁记录),西部数据则侧重ePMR/MAMR路线并优化机械结构。买家最关心的是每TB资本支出、错误率以及大规模部署下的整体表现。供应商的技术之争主要影响良率、可靠性和技术发展空间。

近期信号突显了需求紧张。西部数据表示其2026年全部HDD产能已售罄,且这些产能由覆盖至2028-2029年的多年采购协议锁定。希捷方面,约550 EB的年制造能力仍不足以完全满足超大规模客户的需求。在消费端,希捷受欢迎的28TB外置硬盘在主流零售商处已断货,这同样表明数据中心渠道之外也存在供应紧张。

类别对比:西部数据 vs 希捷

核心AI产品:均为面向温冷分层的近线3.5英寸企业级HDD。

技术重点:西部数据侧重ePMR/MAMR路线及机械与固件优化;希捷主推HAMR以延伸面密度提升空间。

生产状态(2026年):西部数据报告2026年HDD产能已通过多年协议全部售罄;希捷年制造规模约550 EB。

价格趋势:行业目标是从当前每TB低于15美元,在未来2-3年内提升至约25-30美元。

零售信号:希捷28TB外置硬盘在主要渠道售罄。

最新调查显示供应和价格如何变化?

最新的现场调研指出,这一周期正在拉长。HDD需求预计同比增长约40-50%,而供应仅增长约30-35%。这一缺口意味着结构性短缺,定价可能在至少2028年之前保持高位。在价格方面,当前近线HDD每TB低于约15美元,供应商公开目标是在未来2-3年内达到每TB 25-30美元。换言之,平均售价无需暴涨,硬盘制造商就能在美元收入上获得可观的提升。即使稳步走向该区间的中位值,超大规模体量下的收入数字也将发生显著变化。

结合西部数据关于其2026年全部HDD产能已被多年协议锁定,且承诺延伸至2028-2029年的声明,可以明白:超大规模客户正在预订未来产能,而非在现货市场采购。

小贴士:关注多年协议中的每TB价格,而非仅仅现货报价。合同定价和数量承诺能揭示真实的舰队部署计划。

当前AI数据湖中,HDD还是SSD胜出?

两者各有分工。SSD主导延迟敏感型操作:训练暂存、热特征存储、实时检索的向量数据库。HDD仍在大容量经济性上胜出。如果你试图将PB级的嵌入向量和长尾日志放在闪存上,功耗和资本支出将激增。如果试图从HDD运行训练分片,任务则会停滞。

因此真正的答案是分层:闪存在上,硬盘在下,中间用高速网络连接。当预算波动或工作负载变化时,边界会移动,但这一架构不会消失——只会灵活调整。

特性对比:企业级SSD(NVMe) vs 近线HDD

延迟/IOPS:SSD极高,适合热路径;HDD较低,更偏向顺序吞吐。

每TB成本:SSD较高,HDD较低。

每TB功耗:SSD在改善但仍较高,HDD在批量容量下通常更低。

使用场景:SSD用于训练暂存、热特征、实时推理;HDD用于数据湖、检查点、日志、备份、归档。

敏感性:SSD受NAND价格周期影响,HDD受面密度良率和盘片数量影响。

规划人员检查清单

· 映射数据温度:如果80%的字节是冷数据,不要过度购买闪存。

· 预算考虑功耗:每TB功耗比过去更重要。

· 压力测试重建时间:更大容量的驱动器意味着更长的恢复窗口。

· 为分层迁移设计:假设冷热边界会随模型演变而移动。

价格和利润率将如何变化?

从目前看,硬盘制造商的处境相对有利,至少在短期内如此。合同锁定了可见性,供应增长落后于需求增长,而供应商的路线图正推动容量提升,即使没有每TB价格的大幅上涨,也能拉高平均售价。如果市场向调查中提到的每TB 25-30美元目标区间靠近,营业杠杆可能很快在利润表中体现。

然而,硬盘市场以周期性著称。如果NAND价格大幅下跌,部分冷数据工作负载可能会转移到基于QLC的闪存层。如果新型HDD记录技术的良率出现问题,产品产能爬坡将延迟。如果超大规模客户的资本支出委员会因价格冲击而收紧预算,采购可能在一个季度内从囤货转为暂停。

总体来看:上行空间存在,但并非直线。关注出货量、混合每TB价格以及机柜级别的利用率。如果客户开始更积极地压缩数据或收紧保留策略,将导致EB级增长放缓,从而抑制定价能力。

2026年西部数据和希捷有何不同?

在宏观层面,两家公司向相同客户销售同类产品。当前的区别主要在于技术路线、执行能力以及客户承诺结构。希捷押注HAMR技术,理论上能提供更长的面密度提升空间,如果良率稳定,可能在高容量顶级SKU上取得领先。西部数据则通过ePMR/MAMR的迭代改进,加上精密的机械和固件设计来应对。西部数据2026年产能通过多年协议售罄的报告表明其订单储备强劲,而希捷550 EB的规模则显示了其向市场交付硬盘的巨大吞吐量。

对于买家来说,通常取决于大规模部署中的表现:高密度盘位中的振动耐受性、现场故障曲线,以及在百万级驱动器部署中出现固件问题时供应商的支持态度。这些因素无法简单体现在规格表上,却能在数年里决定总体拥有成本。

对比图显示,采用HAMR技术的44TB硬盘相比前代产品,每EB的机架空间和能耗改善约47%,展示了更高密度驱动器如何降低AI大规模存储的基础设施成本。

存储双雄面临的最大风险是什么?

有几个明显的风险,还有一些隐藏在细节中。首先,AI工作负载组合可能发生变化。如果训练集中在更少、更大的模型上,且预训练数据卫生和去重更加激进,那么每轮迭代的新增字节可能减少。其次,如果NAND产能过剩导致SSD价格快速下跌,部分冷数据层可能会尝试以闪存为主的架构。第三,监管和可持续性压力可能将预算从容量转向效率——更多资金投入数据最小化,而非扩大数据湖。

此外还有执行层面:如果记录技术产能爬坡不及预期,容量里程碑将延迟。如果某个超大规模客户暂停订单以消化前期建设,季度业绩将出现波动。尽管这是一个寡头市场,但任何可信的新进入者或现有竞争对手的快速产能扩张,都可能改变定价逻辑。

建设者和投资者应关注哪些信号?

以下是一份短清单,这些信号往往在新闻头条之前出现:

· 多年协议中的合同每TB价格与现货报价的走势。

· EB级出货量以及每机架或每机柜级别的利用率。

· 新记录技术(HAMR、ePMR/MAMR更新)的良率和现场数据。

· 随着容量增加,驱动器重建时间和舰队故障行为。

· 每PB的功耗预算以及来自监管机构的效率要求。

· 弹性测试:买家在HDD分层上推进多远才会回退到SSD。

常见误区

· 认为GPU是唯一瓶颈:存储和网络常常制约吞吐量,先修复最慢的阶段。

· 过度建设SSD:闪存适合热路径,但将冷数据放在上面会大幅推高总拥有成本,应有意识地进行分层。

· 忽视重建窗口:更大容量的驱动器意味着更长的奇偶校验重建时间,需为故障域设计,而非仅仅考虑原始容量。

· 追逐现货交易而忽视合同签订:当供应紧张时,有保障的产能比一次性折扣更重要。

· 低估功耗:每TB功耗如今已成为董事会层面的关键指标,需在全PB规模下建模功耗和冷却。

常见问题

HDD短缺仅仅是因为AI吗?还是其他工作负载也在推动?

AI是主要驱动因素,但并非唯一。传统云存储、视频、备份和合规保留都在增长。当超大规模客户为AI重新配置机架时,他们很少缩减原有资产,而是叠加其上。这使得即便非AI工作负载保持平稳,供应依然紧张。

磁带能否替代HDD用于AI冷数据?

对于深度归档,尤其在保留周期严格且调用频率极低的情况下,磁带仍有吸引力。但恢复时间和操作复杂性使许多AI团队在温冷分层中继续使用HDD,因为他们仍需要定期访问或并行扫描数据。许多舰队同时使用两者:磁带用于深度归档,HDD用于工作数据湖。

如果SSD价格崩溃,HDD的论据是否瓦解?

这会削弱上行空间,但不会让HDD消失。无论价格如何,闪存始终在热分层中胜出。即使价格下跌,SSD在大规模部署下的每TB成本通常仍显著高于HDD。部分冷数据工作负载可能转向QLC,但大量归档和顺序工作负载出于总拥有成本考量,通常会继续使用HDD。

压缩或更智能的数据策划是否会减少需求?

是的。更好的去重、更激进的保留策略以及过滤后的数据集会减缓原始字节增长。但模型复杂性和治理日志也在扩大。这种拉锯战持续存在;在供应紧张周期,买家确实会更积极地推动效率提升。

多年采购协议会锁定买家在不利价格上吗?

它们首先锁定供应,其次才是价格。许多合同设有价格区间或重新谈判触发条件。买家是以最大灵活性换取有保障的产能和可预测的舰队规划。在短缺条件下,这种交换可能是合理的。

去中心化存储网络如何融入?

它们可以承载小众工作负载或作为溢出方案,但超大规模客户仍偏爱严格的控制、已知的故障域和集成工具。更大的故事在于,每TB价格上涨和稀缺性往往会引发实验——当传统渠道收紧时,去中心化选项可能会收到更多询价。

这是关于WDC或STX的投资建议吗?

不。这是背景信息,而非推荐。存储行业具有周期性和风险性。请自行研究,并考虑波动性、技术转型和合同动态后再做决策。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻
自选
我的自选
查看全部
市值 价格 24h%