据多家媒体报道,中科曙光于乌镇互联网大会正式发布全球首个单机柜级640卡超节点——scaleX640。该产品基于AI计算开放架构设计,在算力密度实现20倍惊人突破的同时,还能完全兼容主流AI生态,支持多品牌国产加速卡,以深度开放协同模式全方位带动中国算力体系升级。

就在不久前的GTC大会,英伟达展示了一套完整的AI工业革命基础设施图卷,并给出下一步战略前瞻:通过“极致协同设计”来打破物理定律的限制,将AI推理(Inference)这个新的计算核心成本降至最低,从而持续驱动AI工业发展的良性循环。
显然,随着智算服务器从模块化走向高密度集成化,计算系统的高质量协同成为算力降本增效的主赛道。而在算力集成度和开放普惠之路上,这次国产超节点跑在了前列。
据了解,中科曙光此前就协同产业链上下游发布了AI计算开放架构,意在基于统一的接口规范,使用标准化、商品化的软硬件技术,代替定制化、专有化的系统,进而降低计算成本,实现产业多方共赢和用户终端算力普惠。
在AI计算开放架构基础上,国产超节点可以把计算、存储、网络、供电、冷却、管理、软件等子系统,以GPU为核心进行一体化紧耦合设计,构成更大规模、更高效的超级集群系统,曙光scaleX640已表现出“超强性能、极致效率、全面开放、超高可靠”多项优势特征。
· 超强性能:scaleX640采用“一拖二”高密架构设计,实现单机柜640卡超高速总线互连,双scaleX640超节点组成1280卡计算单元,柜间通过高速网络互连,液体冷凝换热装置CDM为千卡级计算单元提供高达1.72MW的超级散热能力;
· 极致效率:通过软硬协同全局优化,该产品实现MOE大模型训练效率与高通量推理吞吐性能大幅提升30-40%(相比传统架构);通过采用超高速正交架构、超高密度刀片、浸没相变液冷等多技术融合创新设计,成为业界最高集成度的液冷超节点,单机柜算力密度相比业界其他超节点最大提升20倍,PUE值低至1.04;
· 全面开放:基于AI计算开放架构,scaleX640适配支持多品牌AI加速卡,为用户提供更多灵活选择。并且该架构全面兼容主流AI计算软件生态,适配优化400+主流大模型,支持AI模型、业务应用快速无缝迁移与深度优化;
· 超高可靠:从单机RAS特性到集群智能运维与故障恢复机制,产品采用多维可靠性设计,通过30天+长稳运行可靠性测试验证,保障十万卡级超大规模集群扩展部署。
尽管 scaleX640 超节点已实现跨代级突破,但真正值得关注的是——开放式超节点的攻坚难度远高于单体一体化架构。相较于昇腾 384 等单卡集成路线,开放架构不仅链接更多设备、更多厂商、更多软硬件栈,更牵涉跨厂商技术对齐、长链路产业协同与软硬件体系磨合,在国产标准不完备、自主生态仍在起步阶段的背景下,这是一条更难、也更有未来牵引力的路。

据悉,中科曙光作为国内少数完成“芯-端-云-算”全产业链布局的厂商,业务布局广泛覆盖上游芯片、服务器硬件、IO存储到中游云计算平台、大数据平台、算力服务平台以及下游云服务提供商,这也为国产超节点从单点突破到系统创新创造了有力条件。
公开资料显示,中科曙光依托国家先进计算产业创新中心,已与产业上下游伙伴建成“AI计算开放架构联合实验室”,深度推进产业链跨层优化协作。
其后续计划开展底层基础软件与工具链协同优化、模型-硬件协同设计与深度优化、异构算力资源统一调度与管理、开放标准与接口的制定和推广、关键场景跨层优化验证与示范等一系列工作,以此联动国产化全栈力量突破“硬件墙”、“软件墙”、“生态墙”等壁垒。
可以看到,在英伟达等国际巨头开始着眼“系统协同”之际,中国算力厂商正在积极张开怀抱,携手构筑国产计算体系的一体化生态底座,率先夺得AI工业革命基础设施制高点。
考虑到美方对高端GPU持续性的严格管制,国产超节点“换道超车”颇具前瞻性。据月初最新消息,美国总统唐纳德·特朗普表示,“英伟达的最先进芯片将仅供美国公司使用,中国及其他国家无法获得。”基于此,中国厂商更应放弃幻想,积极培育本土产业内生动力。




























