存力觉醒:中科曙光IO500双冠与AI基础设施的范式转移

大力财经 时间:2026-06-24 发表评论

过去两年,AI基础设施的投资叙事几乎被算力芯片垄断。英伟达的GPU、各家厂商的AI芯片、光模块、服务器——这些是资本市场和科技媒体的永恒主角。

但一个被长期忽视的事实正在浮出水面:全球顶级算力集群的GPU平均利用率不到50%。将近一半的算力不是在计算,而是在等数据。换句话说,你花了几亿买的GPU,可能有一半时间是闲置的——因为存储跟不上。

6月24日,在德国汉堡ISC 2026大会上,中科曙光用一张IO500生产型双榜第一的成绩单,宣告了中国存储在这个被低估的战场上站到了世界最高处。

从"配角"到"核心"

在传统的AI基础设施架构中,存储被定位为"数据仓库"——存进去、读出来,快一点慢一点似乎差别不大。但大模型时代的到来彻底改变了这个逻辑。

AI大模型训练是"乱序小读"与"大块顺序写"混合的极端负载。训练数据被随机打散在数十亿文件中,每个训练步骤都要从存储系统中随机抓取小批量数据;每隔一段时间又要将巨大的checkpoint顺序写回。传统存储架构——无论是本地NVMe还是通用并行文件系统——都不是为这种模式设计的。

结果是:算力越强,存储瓶颈越突出。当万亿参数模型在十万卡集群上训练时,存储的每一个I/O延迟、每一次带宽波动,都会被放大为数万张GPU的空转。

ParaStor F9000的设计理念,正是从这个问题出发。它不是通用存储的AI版本,而是为AI混合负载从零设计的"AI原生存储"。

图片

数据说话

IO500生产型双榜第一,是国际权威对这套设计理念的最高认证。生产型榜单要求系统必须已在实际生产环境中长期运行、承载真实业务负载——它不是实验室跑分,是真实世界的实战检验。

在国家超算互联网核心节点,ParaStor F9000已在数万卡集群中稳定运行超过一年。实际效果:千亿级参数大模型部署时间缩短1倍,集群训练效率提升50%。

另一个维度的验证来自科学计算:联合龙讯旷腾MatPL软件,依托scaleX万卡超集群,完成414.7亿原子规模液态水分子动力学模拟,刷新世界纪录。存储系统能在这种级别的计算任务中不掉链子,本身就是最好的"性能说明书"。

图片

全栈协同的系统性优势

ParaStor F9000在硬件与软件层面均实现全栈自主研发。但"全栈"的真正价值不只在于"自主研发"四个字——在于协同。

当计算、存储、网络全部由同一体系掌控时,性能优化不再是各管一段的局部最优。从底层介质到文件系统调度,从网络传输协议到应用层接口,整条数据通路可以被当作一个整体来调优。而这种系统级优化的能力,正是应对AI混合负载这种极端场景的关键。

此前,曙光ParaStor分布式产品曾获IO500 10节点榜单第一,FlashNexus集中式全闪存储亦在SPC-1国际测试中取得领先成绩。从分布式到集中式,从HPC到AI,曙光正在构建一套完整的"存力"产品矩阵。

新范式,新机遇

当算力芯片从稀缺走向相对充裕,决定AI基础设施效率的关键变量正在从"算得多快"转向"数据喂得多饱"。存储,这个长期站在聚光灯外的角色,正在走向舞台中央。

中科曙光IO500双冠,不仅是技术层面的突破,更是对整个产业的一次提醒:AI时代的算力竞赛,下半场的主角可能是存力。

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
网站首页 关于我们 联系方式 使用协议 网站留言RSS订阅违规举报 友情链接