国产超节点擂台赛,华为、阿里、曙光上演三强争霸

2025年,国产超节点玩家开场即沸腾,华为、阿里、中科曙光等厂商拾阶而上,俨然把中国智算集群玩出国际新高度。

近日,继昇腾384、磐久AL128连续刷新行业纪录,曙光最新操刀的全球首个单机柜级640卡超节点——scaleX640粉墨登场,一举将算力集成度抬升至384超节点的20倍,顺利接棒磐久AL128开启守擂环节。

本文谨遵照发布时间排序及各家厂商披露信息,逐一对三大超节点产品展开盘点(由于产品迭进节奏差异,部分产品或已更新性能指标,以下盘点不分高下只论异同)。

500

华为昇腾384,垂直路线一枝独秀

昇腾384超节点Atlas 900 A3 SuperPoD基于分布式多框集群设计与灵衢(LingQu)光互联为架构核心,彼时堪称业界最大规模高速总线互联超节点,创新性集成384颗昇腾NPU和192颗鲲鹏CPU,成功打破AI算力互联瓶颈,并同时满足了AI计算和通用计算需求。

500

其优势在于“以网联算”的技术路径出神入化,基于高速互联总线让超节点像一台计算机一样工作,实现“一卡一专家”并行推理,追求极致的是互联性能。不过在加速卡选择上,384超节点仅支持昇腾910C加速卡,并完全围绕CANN进行生态建设,适配范围相对狭窄。

目前,384开始侧重于“硬件聚焦,软件开放”策略。硬件层面从昇腾NPU、鲲鹏CPU到灵衢总线,构建完整的国产技术体系。软件层面,华为将核心的CANN计算架构、MindSpore深度学习框架等开放给社区,以号召更好开发者补全生态短板。

阿里磐久AL128,软硬协同全栈优化专家

磐久AL128超节点在云栖大会上展示了其极致密度集成能力的突破。如传统服务器机柜通常支持数十个AI计算芯片,而磐久128彼时刷新了单柜支持128个加速卡的纪录,算力集成度可换算为384超节点的4倍。

500

高密度集成背后是散热技术的突破。据悉,该产品采用单相浸没式液冷技术,散热效率比传统风冷提升3倍,使数据中心PUE可低至 1.09,同时冷却系统节能 30%,占地面积减少 50%。

这一技术解决了高密度计算带来的热量积聚问题,确保芯片在最佳温度下持续高性能运行。

不过,最让同行服气的还是阿里的软硬件协同优化能力。磐久AL128超节点与阿里云自研的 HPN 8.0 高性能网络、CPFS 并行文件存储以及人工智能平台 PAI 深度集成,形成了从底层硬件到上层应用的垂直优化体系,通义千问模型基于此实现训练端到端加速比3倍提升。

曙光scaleX640,开放式架构的巅峰之作

曙光scaleX640超节点几乎代表了现阶段计算集群规模极限。该产品作为世界首个单机柜级640卡超节点,是面向万亿参数大模型,基于AI计算开放架构设计的新一代大规模、高效率智算基础设施,具有“超强性能、极致效率、全面开放、超高可靠”等领先特性。

500

scaleX640采用“一拖二”高密架构设计,构建大规模、高带宽、低时延超节点通信域,双机柜合体可组成1280卡计算单元,柜间通过高速网络互连,液体冷凝换热装置CDM为千卡级计算单元提供高达1.72MW的超级散热能力,PUE值低至1.04,算力密度最大增幅达20倍。

更关键之处在于,曙光采用了复杂度最高的全栈开放式架构集成路线,整合算、存、网、电、冷、管等诸多子系统,并基于超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等多技术融合创新设计,MOE大模型训练效率与高通量推理吞吐性能大幅提升30-40%。

结语:

三大超节点产品除了在性能指标上实现代代更新意外,更值得关注的是其路线差异展现出的发展特征。

其中,以单一巨头为主导的垂直一体路线,表现出开发周期短、协同难度低、前期起步快等优势,但在全栈资源整合量级上逊于开放式架构路线,存在一定的扩展性局限。

另外,以阿里、中科曙光为代表的技术路线,在底层硬件选择上支持多种AI芯片,具有开放架构和兼容性设计,具有产业活性足、内生潜力强、算力能效高等优势特征,但在产业链协作难度上存在一定的生态壁垒,需要投入大量资源和精力统一技术接口和协同规范。

总体而言,垂直式路线侧重于单枪匹马打天下,产业链风险可控、链主收益较大,特别适用于行业发展前期培育细分领域龙头;开放式路线强调上下游组团结成命运共同体,风险与收益共担共负,链上参与者积极性更强,尤其有利于行业发展中后期构筑可持续发展底座。

站务

全部专栏