DeepSeek适配华为昇腾 国产AI的自主化之路步入加速期

  【CNMO科技消息】4月24日,国产AI企业深度求索正式发布DeepSeek-V4系列模型预览版,含旗舰版V4-Pro与经济型V4-Flash两个版本,同步完成开源并开放官网、App及API调用服务。值得注意的是,DeepSeek-V4将首次实现与华为昇腾的深度适配,标志着中国AI产业在摆脱对国外技术生态依赖、推进“去CUDA化”进程中迈出了具有里程碑意义的关键一步。

DeepSeek
DeepSeek

  消息发布后,国产芯片概念股迎来集体爆发。寒武纪宣布已基于vLLM推理框架完成对DeepSeek-V4系列模型的Day 0适配,适配代码已开源至GitHub社区。截至午间收盘,华虹公司涨近10%,海光信息涨超9%,杰华特、盛科通信、龙芯中科等个股纷纷跟涨。科创芯片ETF是全市场跟踪同一指数中费率最低的产品,对于长期投资者而言成本优势显著。

  大模型迭代正以“应用驱动算力需求”的方式直接拉动上游芯片产业链的价值重估,而DeepSeek转向适配华为昇腾的战略选择,更标志着国产AI自主化已加速进入实质性落地阶段。

  算力芯片的火热行情

  4月24日早间,DeepSeek-V4正式上线的消息迅速在资本市场发酵,芯片产业链全线走强,算力与模拟芯片方向领涨,综艺股份2连板,富瀚微20cm涨停。午后海光信息一度涨逾11%,寒武纪、摩尔线程等纷纷跟涨。华虹公司在盘中涨幅最高达14%,海光信息、杰华特、盛科通信等涨逾10%,中芯国际、寒武纪涨超6%,多只成分股创出阶段性新高。

DeepSeek适配华为昇腾 国产AI的自主化之路步入加速期

  寒武纪在官方微信号宣布,已基于vLLM推理框架完成对285B DeepSeek-V4-Flash和1.6T DeepSeek-V4-Pro的Day 0适配,适配代码已开源到GitHub社区。对此,中信证券研报指出,Agent与多模态等应用爆发驱动Token调用量井喷,进而加剧国产算力需求紧张,国产大模型在推理端积极适配将为国产算力厂商带来加速放量机遇,预计2026年国产算力芯片出货量至少实现翻倍以上增长。

  在此轮行情中,科创芯片ETF表现尤为突出。该ETF紧密跟踪上证科创板芯片指数,前十大重仓股包含寒武纪、海光信息、中芯国际等国产替代核心标的,行业纯度与战略地位突出。其管理费仅0.15%、托管费0.05%,在全市场跟踪同一指数的ETF中费率最低。对于长期投资者而言,低费率意味着更多收益留存,在AI算力长期增长的确定性趋势下,这一成本优势将成为影响长期复利效应的重要因素。

  从技术突破到国产闭环

  本次DeepSeek-V4系列包含两大MoE架构模型:旗舰版V4-Pro总参数1.6万亿、激活参数49B,预训练数据33T;经济型V4-Flash总参数284B、激活参数13B,预训练数据32T。两款模型均标配百万token超长上下文,MIT协议完全开源。

DeepSeek适配华为昇腾 国产AI的自主化之路步入加速期

  在技术架构层面,V4首创混合注意力机制,结合压缩稀疏注意力(CSA)和重度压缩注意力(HCA),并引入流形约束超连接(mHC)替代传统残差连接,大幅增强了深层网络信号传播的稳定性。在百万token上下文设置下,V4-Pro单token推理算力消耗仅为V3.2的27%,KV缓存占用仅为10%。

  在硬件适配层面,DeepSeek-V4与国产芯片生态的深度融合是最核心的突破。华为方面随即宣布,通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek-V4系列模型。昇腾950通过融合kernel和多流并行技术大幅提升推理性能,在8K输入场景下可实现单卡Decode吞吐4700TPS;昇腾A3 64卡超节点结合大EP模式部署,基于vLLM推理引擎可实现2000+TPS的单卡Decode吞吐。

  在商业化落地层面,DeepSeek已通过与腾讯元宝等平台深度合作积累了大量用户,其开源策略与商业化并行的发展模式使技术快速渗透至政务、智能汽车等多个场景,形成了“技术突破→硬件适配→应用落地”的完整产业闭环。

  资本与生态双轮驱动

  就在DeepSeek-V4发布的数日前,DeepSeek首次启动外部融资的消息已引发市场关注。据外媒报道,DeepSeek计划以不低于100亿美元的估值募资不少于3亿美元。而后估值目标迅速攀升,多家媒体报道本轮融资的估值已从此前的“不低于100亿美元”飙升至逾200亿美元,腾讯与阿里已正式进入投资洽谈阶段。创始人梁文锋此前曾多次以“不融资”立场拒绝外部资本,本轮融资标志着该公司正式打开了资本运作的大门。

DeepSeek适配华为昇腾 国产AI的自主化之路步入加速期

  此次融资对国产AI自主生态建设具有多重意义。首先,资金将重点用于下一代旗舰模型研发与昇腾芯片生态的深度适配,加速缩短国产大模型与国产芯片之间的软硬件协同周期。值得注意的是,从英伟达CUDA向华为CANN架构的生态迁移需要投入大量工程资源重写核心代码,融资将为这一过程提供更充裕的资金支持。DeepSeek已明确表示,受高端算力限制,V4-Pro当前服务吞吐有限,预计下半年昇腾950超节点批量上市后价格将大幅下调。

  山西证券研报指出,DeepSeek-V4等国产大模型有望原生适配国产算力,供需两旺下国产芯片对通信芯片解决方案的需求更为迫切,建议关注超节点交换芯片、IOD chiplet、国产高速网卡三大算力通信方向。在“资本投入>模型升级>芯片适配>应用爆发”的正向飞轮驱动下,DeepSeek本轮融资不仅是一家企业的资金补充,更是对整个国产AI算力产业链的战略赋能,将吸引更多下游应用厂商加入昇腾生态,进一步巩固中国AI自主化根基。

  结语

  DeepSeek适配华为昇腾,寒武纪等厂商快速跟进,标志着中国AI产业链正加速打通“模型—芯片—应用”的自主闭环。V4的流形约束超连接架构与百万上下文能力已达开源领先水平,算力效率与推理性能实现质的跨越。从生态看,全栈适配昇腾是“去CUDA化”的关键一步,形成国产模型与硬件深度融合的标杆。从资本看,DeepSeek首次融资估值迅速攀升至近200亿美元,将加速国产大模型与芯片的软硬件协同迭代。

  在全球大模型竞赛持续升温背景下,科创芯片ETF以全市场最低的0.15%管理费,为长期投资者提供分享国产算力增长的便捷工具。中信证券预计2026年国产算力芯片出货量至少翻倍,将为设计、先进制程、封装等产业链带来强劲动能。技术进步与资本入场双重力量正共同推动国产AI生态进入确定性最强的成长期,中国AI产业自主化的道路正加速前行。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平