AI算力爆发式增长,数据中心面临哪些挑战?专家这样说⋯⋯

随着人工智能(AI)技术飞速发展,算力需求呈现爆发式增长。从GPT-1到GPT-5,模型参数量从1.17亿跃升至数万亿,模型结构也在不断演进,从稠密LLM模型向MoE稀疏化模型以及多模态模型持续演进。

面对这一趋势,单纯依靠传统服务器的简单堆叠已无法满足需求,AI算力设施正加速向高密度、液冷化、集群化方向演进,这不仅带来了更高的功率负载和更复杂的散热要求,也对传统数据中心的散热、供配电系统、网络设计等提出了新的挑战

9月17日,在上海召开的首届AIDC产业发展大会上,中国电子工程设计院数据中心事业部副总经理王志强向包括《每日经济新闻》在内的媒体记者表示:“当前整个GPU芯片及AI集群的功率密度演进速度,已超过传统云数据中心的技术演进路径。超高密度、超大规模部署,使基础设施在动力适配、楼体结构、空间规划等方面面临巨大挑战。”

在王志强看来,为匹配AI负载的快速演进对算力的需求,机房要具备足够的灵活性和弹性扩展能力,并且在机房的规划和建设模式上也需具有前瞻性。


首届AIDC产业发展大会现场 图片来源:每经记者 王晶 摄

算力设施将走向高密、液冷

事实上,随着AI训练与推理任务复杂度的不断提升,单机柜功率正从当前的50kW(千瓦,功率计量单位)向300kW甚至更高水平跃进。与此同时,超节点规模的扩展也使得单集群供电需求跃升至数百MW(兆瓦,电功率的基本单位),远远超过了现有数据中心单栋楼10—20MW的供电能力。

在实际部署落地的过程中,高功率密度带来基础设施的升级挑战远比想象中复杂。

王志强表示:“去年单柜20kW还算主流,今年华为384型机柜已经做到60kW,而字节、阿里、腾讯这些互联网大厂在推理和训练场景的单柜容量很快会突破100kW。”

功率密度外,制冷也成为数据中心投资规划中无法回避的难题。在冷却技术方面,风冷方案已接近极限,液冷成为转型方向。这意味着数据中心的基础设施必须同步迭代。

对此,当日(9月17日)发布的《AIDC机房参考设计白皮书》中对AIDC(AI数据中心)的设计思路及部署模式给出了一些建议。比如:构建全链路高效供电体系,中低压配电系统按最大容量池化设计;在建筑结构规划上,机房设计必须预留充足的层高和承重余量,以适配不断增重的AI服务器及相关设备,同时保障后续设备更新换代的灵活性;对于超节点域内的互联走线,按照最短互联走线距离进行规划设计,确保超节点内时延最低。

在全球计算联盟(GCC)秘书处CTO苗福友看来,未来两三年,国内AIDC建设仍将保持每年40%以上的年增速,随后每年新增建设量还会增加,然后慢慢趋于平缓。预计到2030年前后,年增长率或在10%左右。

与新建机房相比,当前更为现实的问题是,存量数据中心机房以低密风冷机房为主,面向AIDC高密液冷机柜需求,如何才能实现平滑演进?

对此,王志强介绍了几种路径:第一,在规划层面要引入模块化理念;第二,做到风液兼容和匹配,原来风液比是4∶6,未来一年就可能变成1∶9。“确实很难,但我们已经找到了一些出口,比如在荷载层面、空间层面、架构层面做适度合理的极简。”

中外AIDC发展路径存在差异

今年以来,海外科技巨头们在AI基建上持续加码。今年8月,OpenAI CEO奥特曼表示,未来公司将投入数万亿美元夯实AI基建,用于支持各项人工智能服务。更早之前,Meta CEO扎克伯格也表示,Meta将斥资数千亿美元建设几个大型AI数据中心。

据统计,2025年年初以来,多个国家和地区纷纷宣布将千亿美元以上资金规模投向AI基建领域。

针对我国AIDC和海外AI基建之间的发展路径差别,王志强回应称: “在功率密度上,国际领先项目已普遍达到120至150kW/柜,英伟达2028年规划向600kW推进,更追求单柜的超高密度;而国内更多依靠光网络封装,在我们可以掌握的制程下,通过集群的方式来解决,目前主流在40-60kW/柜。在技术路线上,海外更注重GPU的性能发挥,常配置冷机提供中温冷冻水,通过更低的水温使GPU能够工作在更高效的功率段上,而国内受节能降耗驱动,大概供水的水温在30—40摄氏度,是比较高的,可以实现全年的自然冷却(可能会限制部分算力设备的峰值性能)。”

此外,在集群规模上也面临差距。“海外已实现10万卡的集群落地,而国内基于国产算力卡的超大规模集群也在做,但规模再大就会面临组网的挑战。不过目前很多技术,比如硅光封装、光互联等正在解决产业界的问题。”王志强说道。

虽然我国AIDC建设面临诸多挑战,但产业各方已积极行动。中国电子技术标准化研究院高级工程师沈芷月介绍称,在标准方面,全球计算联盟(GCC)已经布局了智能计算、数据中心、机密计算、边缘计算、绿色计算等多个领域的重点标准,目前已发布20项,预计年底将达到30项。在技术的研发与创新方面,针对目前AIDC面临的热、电、空间等问题的挑战,产业界将继续投入新技术的研发和推广,以提升AIDC的能效和性能。此外,还会加大产业协同与生态建设。

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平