从单卡争锋到集群竞速：中国AI算力生态迈入开放架构新周期

在万亿参数模型成为AI“入场券”的当下，算力竞赛的底层逻辑正在发生深刻质变。而日前举办的第七届中国超级算力大会（ChinaSC2025）上，中国智能计算产业联盟联合益企研究院发布《2025中国算力发展研究报告之AI计算开放架构》（下称《报告》）、“九源”智能计算系统生态联合体成立等重磅动作则共同指向一个趋势，那就是AI产业的决胜点，正从对“单卡性能”的盲目崇拜，转向对“万卡集群效率”的极致追求；产业模式也正从“垂直封闭”的“苹果模式”，迈向“水平分工”的“安卓模式”。一个以开放架构为底座的智算新周期已然开启。

算力竞争换道，从单卡性能转向集群效率

众所周知，长期以来，AI算力竞争被简化为围绕单卡峰值性能（FLOPS）的“军备竞赛”。然而，当模型参数从千亿跃升至万亿，尤其是MoE（混合专家模型）等复杂架构成为主流时，产业界开始意识到，单纯堆叠高性能芯片，无法线性换来模型训练效率的提升。而真正的瓶颈则在于“集群效率”。

对此，有业内专家指出，当AI集群规模达到万卡甚至十万卡时，系统的性能瓶颈往往不在芯片内部，而在芯片之间，具体表现在数据墙、通信墙、I/O墙以及能耗墙，共同构成了阻碍AI继续扩展的“效率墙”。以目前主流AI集群为例，即使单卡性能不断提升，但通信效率若下降5%，模型训练的总时长可能增加数周，算力利用率也将骤降20%以上。

与此同时，国内AI算力还面临“异构并存”下多品牌、多架构AI加速卡共存的现实国情，而在此种现实之下，若缺乏统一的软件栈与开放的硬件标准，极易形成“算力孤岛”，这意味着，即便是算力供给总量在增长，但可用效率却被架构割裂所消耗。

针对上述挑战，《报告》提出：AI产业的发展拐点，正从“堆算力”转向“组织算力”，尤其是在智能算力总规模逼近千EFLOPS的当下，算力资源的组织方式、系统间协同效率及架构开放程度，将决定未来AI创新的速度和边界。换言之，谁能率先实现“集群效率”的跃迁，谁就能在新一轮智能化浪潮中占据先机。

开放共生，AI计算开放架构重塑产业新秩序

面对上述“单卡性能代差”与“集群效率瓶颈”的双重挑战，《报告》提出了中国AI产业的破局路径，即AI计算开放架构（Open AI Computing Architecture）。这不仅是一项技术标准，更是一场产业组织方式的范式革命。

《报告》称，AI产业正从“垂直封闭”的“苹果模式”，转向“水平分工”的“安卓模式”。在传统的封闭模式下，硬件、软件与生态被强行绑定，厂商各自为阵。尤其在国内异构算力并存的现实下，这种封闭模式容易造成重复研发、标准割裂和资源浪费。相比之下，开放架构的核心思想，则是通过“水平分工”，以“集群规模效益弥补单卡性能代差”。

而提及开放架构，根据《报告》定义，AI计算开放架构应具备“多元算力、高速互连、存算协同、绿色高效、稳定可靠、生态繁荣”六大特征，强调建立统一的接口规范与标准体系，向上兼容主流AI软件生态（如飞桨、PyTorch、TensorFlow等），向下适配多品牌AI加速卡，形成软硬协同、生态共建的新模式。

事实是，这场“开放革命”已在产业层面展开。例如大会期间，中科曙光作为常务理事成员单位加入“九源智能计算系统生态联合体”，推动其DeepAI深算智能引擎与“九源”智能计算软件栈标准对接，体现了开放架构理念的落地实践。正如中科曙光总裁助理、智能计算产品事业部总经理杜夏威所言：“中科曙光与九源联合体在智能计算系统生态发展理念上高度契合，将携手其他成员在AI软件栈兼容性、系统标准制定、生态适配与行业应用等领域开展深度合作，共建自主可控AI生态。”

scaleX640登场，以开放架构定义中国智算新底座

当然，上述理念的转变和生态的协同，最终需要一款“现象级”的硬件产品来承载，而这便是中科曙光最新推出的scaleX640超节点。它是全球首个单机柜级640卡超节点系统，面向万亿参数大模型而生，也是继曙光9月份发布AI超级群系统后，首个AI计算开放架构完整落地的产品。

首先scaleX640的设计思路极具代表性，以架构协同取代了堆料式性能扩展。通过“一拖二”的高密设计，单机柜即可实现640卡高速总线互连；通过机柜间高速网络互联，双scaleX640超节点组成1280千卡计算单元。与此同时，浸没相变液冷等创新技术加持，可提供高达1.72MW的散热能力，使得其在高功耗、高密度环境下仍能维持极致稳定运行。

性能之外，更关键的是效率与开放。曙光scaleX640中首次实现软硬协同全局优化，在MoE大模型训练与高通量推理场景下，整体性能相较传统架构提升约30%-40%。更值得关注的是，scaleX640完全基于AI计算开放架构，可兼容多品牌AI加速卡，支持包括飞桨、PyTorch、TensorFlow在内的主流AI框架，以及400余种大模型的快速迁移与优化。这意味着，开发者无需被绑定在单一厂商生态中，而可在开放环境中实现灵活扩展。

在运维与可靠性层面，采用多层级RAS机制和智能容错系统，scaleX640已通过30天以上长稳运行验证，可扩展至十万卡级集群。

由上述可见，scaleX640不仅具备超强算力，更代表着算、存、网、电、冷、管、软七大子系统协同运行的“体系化开放”能力，是开放架构下新的完整AI基础设施底座。

对此，中科曙光高级副总裁李斌表示，“scaleX640超节点的推出承载双重关键意义，一是通过开放架构创新突破算力瓶颈；二是支撑前沿大模型持续创新，为各行业‘人工智能+’打造坚实高效、好用易用的智算基础设施。”

而在我们看来，从技术到生态，scaleX640所代表的，正是中国算力产业的集群化方向，即不再强调单点极限性能，而是以系统整体效率与生态协同为核心，而这与报告中所提倡的“AI计算开放架构”趋势可谓高度契合，符合AI产业的发展趋势。

可以说，scaleX640既是这一理念的技术样本，也是中国AI算力体系重塑的一个标志性节点。不仅意味着中科曙光在技术路线上的领先，也预示着国产AI算力体系正从“设备制造”走向“架构定义”。而它的开放兼容特性，为异构计算环境中的协同提供了现实路径，对中国AI基础设施的标准化建设具有示范意义。

写在最后：从“开放架构”定义之初，到中科曙光推出的scaleX640超节点，再到《报告》的发布，我们可以看到，中国AI算力体系正形成以开放架构为桥梁，以集群效率为核心，以生态协作为牵引的进化路径。与此同时，AI竞赛的决胜点正在从单卡性能到集群效率，从封闭体系到开放生态的转移。而这对于正在加速升级的中国智算产业而言，不仅是一次技术路线的选择，更是一场产业格局的重塑。

用哪个弄湿

少儿国寿福庆典版优缺点在哪？不足和亮点各参半

狗狗吃卫生巾怎么办

房贷二次扣款会影响征信吗？这是很有可能的

2020最新自助免费申请Office365教育版，免费5TOneDrive云盘详细图文教程

MacBook怎么绕过BootCamp安装Win10双系统

上海电信千兆宽带速度究竟如何上海电信千兆宽带

国内知名的前端博客

域名为什么会被墙如何检测域名是否被墙域名被墙如何处理

从单卡争锋到集群竞速：中国AI算力生态迈入开放架构新周期

更多文章

站内搜索

标签云

热门文章

友情链接