直击MWC 2026:华为超节点算力集群首次面向海外市场亮相

每经记者:王晶 每经编辑:董兴生

当地时间3月2日,在2026年世界移动通信大会(以下简称“MWC 2026”)期间,华为推出了智算超节点Atlas 950 SuperPoD、通算超节点TaiShan 950 SuperPoD等多个型号超节点产品及解决方案。这也是华为首次面向海外市场展示超节点算力集群

图片来源:每经记者 王晶 摄

当前,人工智能加速发展,每个月都在突破认知。智能体(Agentic AI)时代下,模型从仅限于LLM(大语言模型)走向全模态的原生融合,万亿级的模型参数和10万亿级的数据训练成为标配,算力需求提升十倍到百倍。同时,模型支持的上下文序列长度从K级提升到M级,具备更长久的记忆能力,但对内存容量和带宽的需求也提升了5至10倍。

随着AI深入行业应用,实时性挑战愈发凸显。在金融风控场景,时延要求小于20毫秒,反欺诈场景的时延则要在10毫秒以下。智能体还需要更多任务协同和多轮次推理迭代,传统的计算架构难以满足低时延要求。

单一芯片的提升已经无法满足AI的算力需求,必须依赖多芯片互联、做大规模计算节点的方式来解决。

去年,华为发布了业界规模最大的超节点,即昇腾384超节点。华为将384颗昇腾AI芯片连接在一起组成集群,通过全对等高速互联架构,基于系统工程方法,对计算、内存、通信的极致优化调度,可提供高达300PFLOPs的密集BF16算力,该性能表现接近英伟达GB200 NVL72系统的两倍。

“由于美国制裁,我们不能产出最先进工艺制程的芯片,但我们基于过去30多年构筑的联接技术能力,使得我们能够做到万卡级的超节点,经营万卡级的超节点,做到在世界上算力最强。”去年9月,华为副董事长、轮值董事长徐直军在华为全联接大会上说。

当时,他罕见地披露了关于昇腾芯片、超节点、集群以及灵衢互联协议在内的规划以及未来的演进和目标,其中就包括此次在MWC 2026上亮相的Atlas 950 SuperPoD等产品。

所谓超节点,是指通过系统工程方法,将成千上万颗芯片高效互联,形成一个逻辑统一的超级计算机,从而实现整体算力的跨越式增长。超节点是华为在算力战场上“以架构创新打破制程封锁”的战略支点,它不再依赖于单芯片性能的极限突破。

不过,要把这么多张“卡”连起来,对互联技术构成了巨大挑战。为此,华为开创了面向超节点的互联协议“灵衢”,可以把更多计算资源连接到一起。但客观来看,集群也面临诸如能耗、占比面积大等问题,昇腾384超节点在超越英伟达NVL72的同时,功耗也达到后者的4.1倍,每FLOP(浮点运算)功耗高出2.5倍。

产品演进方面,2025年3月,华为推出基于灵衢1.0的Atlas 900超节点,满配支持384卡,自交付以来已在互联网、电信、制造等行业实现商用部署数百套。此后,在灵衢1.0基础上进行功能与规模优化,形成灵衢2.0版本,此次华为展示的Atlas 950 SuperPoD便基于灵衢2.0演进。

华为计算产品线总裁张熙伟在会上表示,Atlas 950 SuperPoD智算超节点,以单柜64卡为基本单元,最大可支持8192张NPU卡高速互联,为超大规模AI训练与海量推理并发场景提供选择;TaiShan 950 SuperPoD则是业界首款通算超节点,可以解决通算场景时延高、数据搬移开销大、协同效率低的难题。

如果说硬件性能的突破是基础,那么繁荣的软件生态就是昇腾能否长期繁荣的关键,开源策略成为华为算力体系的另一组成部分。会上,华为方面表示,华为全面开源开放CANN异构计算架构,通过分层解耦,已经将算子库、加速库、图计算、编程语言等软件代码全量开源,支持开发者按需使用,加速自主创新。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平