从单卡争锋到集群竞速:中国AI算力生态迈入开放架构新周期

在万亿参数模型成为AI“入场券”的当下,算力竞赛的底层逻辑正在发生深刻质变。而日前举办的第七届中国超级算力大会(ChinaSC2025)上,中国智能计算产业联盟联合益企研究院发布《2025中国算力发展研究报告之AI计算开放架构》(下称《报告》)、“九源”智能计算系统生态联合体成立等重磅动作则共同指向一个趋势,那就是AI产业的决胜点,正从对“单卡性能”的盲目崇拜,转向对“万卡集群效率”的极致追求;产业模式也正从“垂直封闭”的“苹果模式”,迈向“水平分工”的“安卓模式”。一个以开放架构为底座的智算新周期已然开启。

算力竞争换道,从单卡性能转向集群效率

众所周知,长期以来,AI算力竞争被简化为围绕单卡峰值性能(FLOPS)的“军备竞赛”。然而,当模型参数从千亿跃升至万亿,尤其是MoE(混合专家模型)等复杂架构成为主流时,产业界开始意识到,单纯堆叠高性能芯片,无法线性换来模型训练效率的提升。而真正的瓶颈则在于“集群效率”。

对此,有业内专家指出,当AI集群规模达到万卡甚至十万卡时,系统的性能瓶颈往往不在芯片内部,而在芯片之间,具体表现在数据墙、通信墙、I/O墙以及能耗墙,共同构成了阻碍AI继续扩展的“效率墙”。以目前主流AI集群为例,即使单卡性能不断提升,但通信效率若下降5%,模型训练的总时长可能增加数周,算力利用率也将骤降20%以上。

与此同时,国内AI算力还面临“异构并存”下多品牌、多架构AI加速卡共存的现实国情,而在此种现实之下,若缺乏统一的软件栈与开放的硬件标准,极易形成“算力孤岛”,这意味着,即便是算力供给总量在增长,但可用效率却被架构割裂所消耗。

针对上述挑战,《报告》提出:AI产业的发展拐点,正从“堆算力”转向“组织算力”,尤其是在智能算力总规模逼近千EFLOPS的当下,算力资源的组织方式、系统间协同效率及架构开放程度,将决定未来AI创新的速度和边界。换言之,谁能率先实现“集群效率”的跃迁,谁就能在新一轮智能化浪潮中占据先机。

开放共生,AI计算开放架构重塑产业新秩序

面对上述“单卡性能代差”与“集群效率瓶颈”的双重挑战,《报告》提出了中国AI产业的破局路径,即AI计算开放架构(Open AI Computing Architecture)。这不仅是一项技术标准,更是一场产业组织方式的范式革命。

《报告》称,AI产业正从“垂直封闭”的“苹果模式”,转向“水平分工”的“安卓模式”。在传统的封闭模式下,硬件、软件与生态被强行绑定,厂商各自为阵。尤其在国内异构算力并存的现实下,这种封闭模式容易造成重复研发、标准割裂和资源浪费。相比之下,开放架构的核心思想,则是通过“水平分工”,以“集群规模效益弥补单卡性能代差”。

而提及开放架构,根据《报告》定义,AI计算开放架构应具备“多元算力、高速互连、存算协同、绿色高效、稳定可靠、生态繁荣”六大特征,强调建立统一的接口规范与标准体系,向上兼容主流AI软件生态(如飞桨、PyTorch、TensorFlow等),向下适配多品牌AI加速卡,形成软硬协同、生态共建的新模式。

事实是,这场“开放革命”已在产业层面展开。例如大会期间,中科曙光作为常务理事成员单位加入“九源智能计算系统生态联合体”,推动其DeepAI深算智能引擎与“九源”智能计算软件栈标准对接,体现了开放架构理念的落地实践。正如中科曙光总裁助理、智能计算产品事业部总经理杜夏威所言:“中科曙光与九源联合体在智能计算系统生态发展理念上高度契合,将携手其他成员在AI软件栈兼容性、系统标准制定、生态适配与行业应用等领域开展深度合作,共建自主可控AI生态。”

scaleX640登场,以开放架构定义中国智算新底座

当然,上述理念的转变和生态的协同,最终需要一款“现象级”的硬件产品来承载,而这便是中科曙光最新推出的scaleX640超节点。它是全球首个单机柜级640卡超节点系统,面向万亿参数大模型而生,也是继曙光9月份发布AI超级群系统后,首个AI计算开放架构完整落地的产品。

首先scaleX640的设计思路极具代表性,以架构协同取代了堆料式性能扩展。通过“一拖二”的高密设计,单机柜即可实现640卡高速总线互连;通过机柜间高速网络互联,双scaleX640超节点组成1280千卡计算单元。与此同时,浸没相变液冷等创新技术加持,可提供高达1.72MW的散热能力,使得其在高功耗、高密度环境下仍能维持极致稳定运行。

性能之外,更关键的是效率与开放。曙光scaleX640中首次实现软硬协同全局优化,在MoE大模型训练与高通量推理场景下,整体性能相较传统架构提升约30%-40%。更值得关注的是,scaleX640完全基于AI计算开放架构,可兼容多品牌AI加速卡,支持包括飞桨、PyTorch、TensorFlow在内的主流AI框架,以及400余种大模型的快速迁移与优化。这意味着,开发者无需被绑定在单一厂商生态中,而可在开放环境中实现灵活扩展。

在运维与可靠性层面,采用多层级RAS机制和智能容错系统,scaleX640已通过30天以上长稳运行验证,可扩展至十万卡级集群。

由上述可见,scaleX640不仅具备超强算力,更代表着算、存、网、电、冷、管、软七大子系统协同运行的“体系化开放”能力,是开放架构下新的完整AI基础设施底座。

对此,中科曙光高级副总裁李斌表示,“scaleX640超节点的推出承载双重关键意义,一是通过开放架构创新突破算力瓶颈;二是支撑前沿大模型持续创新,为各行业‘人工智能+’打造坚实高效、好用易用的智算基础设施。”

而在我们看来,从技术到生态,scaleX640所代表的,正是中国算力产业的集群化方向,即不再强调单点极限性能,而是以系统整体效率与生态协同为核心,而这与报告中所提倡的“AI计算开放架构”趋势可谓高度契合,符合AI产业的发展趋势。

可以说,scaleX640既是这一理念的技术样本,也是中国AI算力体系重塑的一个标志性节点。不仅意味着中科曙光在技术路线上的领先,也预示着国产AI算力体系正从“设备制造”走向“架构定义”。而它的开放兼容特性,为异构计算环境中的协同提供了现实路径,对中国AI基础设施的标准化建设具有示范意义。

写在最后:从“开放架构”定义之初,到中科曙光推出的scaleX640超节点,再到《报告》的发布,我们可以看到,中国AI算力体系正形成以开放架构为桥梁,以集群效率为核心,以生态协作为牵引的进化路径。与此同时,AI竞赛的决胜点正在从单卡性能到集群效率,从封闭体系到开放生态的转移。而这对于正在加速升级的中国智算产业而言,不仅是一次技术路线的选择,更是一场产业格局的重塑。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平