【CNMO科技消息】2026年4月末,DeepSeek发布了长达58页的V4技术报告。在近300人的作者名单中,10位核心研究者被标注了“已离职”——这个细节像一道裂缝,悄然撕裂了这家“技术理想主义”标杆的完美表象。
两个月后,一则消息震惊中国AI圈:国家集成电路产业投资基金(大基金)正洽谈领投DeepSeek首轮融资,估值从最初的100亿美元飙升至450亿美元,甚至有望冲击500亿美元。这家曾以“零外部融资”为信条的明星公司,终于向资本打开了大门。

从“不接受外部融资”到“450亿估值”,DeepSeek的战略转向并非金钱饥渴的投机,而更像一场关乎生存的防御战。三条逻辑线交织其中:留不住人倒逼融资,融资能否止住人才失血,资本入场后将如何重塑公司基因?这是一道没有标准答案的三重命题。
人才“精准流失”,理想挡不住高薪
表面看,DeepSeek的人才状况并不糟糕。V4技术报告中10人标注“已离职”,以近300人的研发团队为分母,整体离职率仅约3.7%,放在任何行业都堪称优异。
但危险不在于“多少人离开”,而在于“离开的是什么人”。2025年下半年至今,DeepSeek确认有至少5名核心研发成员离职,覆盖基座模型、推理、OCR、多模态四条核心技术主线。
这五人几乎构成了一支完整的AI研发“梦之队”:第一代大语言模型核心作者王炳宣加入腾讯混元团队,他从零搭建了DeepSeek的基座模型能力;V2核心贡献者罗福莉被雷军以千万年薪招揽至小米,担任MiMo大模型负责人;R1核心研究员郭达雅入职字节跳动Seed团队,担任Agent方向负责人之一,职级L8;多模态技术核心研究员阮翀加入自动驾驶公司元戎启行,出任首席科学家;OCR系列核心作者魏浩然也已离职。
更值得警惕的是,罗福莉并非2025年下半年后才离开的个案。V4技术报告披露前,她已于2025年加入小米,属于“更早离开”的核心成员。这意味着DeepSeek的人才失血并非短期事件,而是一个持续进行的结构性过程。
如果DeepSeek是一个数千人的庞大组织,流失五个研究员或许只是皮外伤。但DeepSeek的核心研发团队仅约100余人,基座模型架构团队更是只有小几十人。这支团队的构成极为特殊:本科和硕士占比超七成,30岁以下超七成,几乎不社招,以应届生和实习生留任为主。
在这样的精锐团队中,每一个核心研究员的权重被放大到了极致。王炳宣参与过历代模型训练,是DeepSeek从0到1的基座搭建者;郭达雅是V2、V3、R1系列模型的核心作者,一个人横跨推理、代码两大方向。对大厂而言,流失一个核心研究员是局部损失;对DeepSeek而言,流失一个核心研究员意味着整条技术线出现断层。

人才流失的直接后果,是技术迭代节奏被打乱。V4模型从原定2026年2月中旬上线一再推迟,直至4月24日才发布预览版。一度以“月更模型”闻名的DeepSeek,2025年12月至2026年3月期间大版本迭代为零,同期OpenAI迭代4次,Anthropic至少2次。
当然,V4延迟不能简单归咎于人才流失——V4选择了一条极其艰难的国产化道路,完全基于华为昇腾芯片训练,工程师们需要完成从英伟达CUDA生态向华为CANN架构的底层迁移。但不可否认,核心人才流失与模型延迟之间,存在不容忽视的关联。
首轮融资,本质是一场“人才保卫战”
随后,DeepSeek的融资进程如同火箭蹿升:
4月初,启动首轮融资接触,初始估值约100亿美元,原计划仅募资3亿美元用于期权发放;4月下旬,腾讯、阿里等巨头入局洽谈,估值快速抬升至200亿美元;5月上旬,大基金洽谈领投,估值直接跳升至450至515亿美元。
参与谈判的潜在投资方包括国家大基金、腾讯等互联网巨头,以及其他国资背景基金。更引人注目的是,创始人梁文锋计划个人出资约200亿元,占本轮募资总额的40%,为估值托底。融资完成后,梁文锋的直接持股由1%提升至34%,最终受益股份达84.29%,表决权比例100%,牢牢掌握公司的绝对控制权。
国家大基金此次选择领投DeepSeek,释放了强烈的战略信号——这是大基金首次公开布局国内头部大模型公司,标志着国家资本正从硬件补短板转向软硬件协同建生态。
而对于Deepseek来说起融资的三大核心目的:
第一,期权定价,最核心的目标。融资前,DeepSeek的员工期权没有市场化估值,是一纸无法兑现的“期票”。融资后,450亿美元的投后估值将彻底改变这一局面——每股期权有了明确的价格标签,员工终于能看到“纸面财富”变成现金的路径。据知情人士透露,这轮融资的核心目标就是“为全员期权做一个市场定价”,梁文锋自掏腰包为这个价格托底。
第二,算力补血,最现实的痛点。随着大模型参数规模持续扩张,训练与推理成本同步飙升。幻方量化虽然能在一定程度上为DeepSeek输血——仅2025年一年就在700亿元管理规模基础上实现了超55%的收益——但面对V4万亿参数模型的训练成本和不断增长的推理需求,单一金主的支持终究有限。外部融资补上了这个“烧钱”缺口。
第三,行业对标,最紧迫的需要。当字节跳动凭借Seed团队的期权体系大规模吸引AI人才、腾讯以CEO办公室直属AI实验室灵活布局、阿里千问团队持续扩张时,DeepSeek如果不获得资本背书,将在人才争夺战中彻底丧失出价能力。融资不仅是筹钱,更是获得与科技巨头在同一条跑道上竞争的入场券。
资本介入,三大风险直击命脉
梁文锋此前多次公开表示拒绝外部融资,核心立场是“杜绝资本干预技术路线、避免短期商业化裹挟长期AGI研发”。
资本市场讲的是盈利、ROI和退出路径。当DeepSeek被绑上450亿美元估值的快车,投资人期待的将不仅是在技术上领先,更是在商业上兑现。V4发布后,DeepSeek已大幅降低产品价格,“其使用成本远低于美国竞争对手,价格比OpenAI产品低97%”,这被分析人士解读为吸引企业用户、开发者和Agent用户的策略。同时,公司计划在6月推出V4.1版本,正式整合多模态能力和商业化能力,“从能聊天升级到能干活”。商业化步伐明显提速,这与当初“不做商业、纯搞AGI”的初心形成了微妙张力。
因此,融资对于企业来说是一把双刃剑。短期看,期权定价让现有员工受益;但长期看,融资本身拉高了整个行业的薪酬天花板。
DeepSeek的450亿美元估值,意味着后续招聘和留人成本将指数级上升。当竞争对手可以参考这一估值来出价时,DeepSeek自身反而可能陷入“融资→加薪→再融资”的循环。更棘手的是,DeepSeek原本以“技术信仰”凝聚团队,当薪酬体系全面向大厂看齐后,那种“我们不一样”的理想主义凝聚力是否还能持续?艾媒咨询数据显示,2025年中国AI智能体市场规模已达804亿元,同比增长123.2%,预计2030年将突破6000亿元。千亿级市场的开启意味着人才需求只会更大,博弈也将更激烈。
融资前,DeepSeek是一家可以“任性”的公司——创始人说了算,研发节奏自己定,不求商业化回报。融资后,外部董事的介入、投资者的预期管理将成为必须面对的现实。

虽然梁文锋依然手握超84%的股份和100%表决权,短期内控制权不会旁落,但资本的影响力从来不只是股权数字。当投资人期待技术变现、当市场紧盯商业化进展、当媒体用商业指标衡量公司价值——DeepSeek的“技术浪漫主义”文化将面临持续的外部压力。那些最初被“做改变世界的研究”所吸引而来的人才,可能会发现公司慢慢变得和他们当初想要逃离的大厂越来越像。
450亿美元的估值是一个沉重的“锚”。这一估值是在短短几周内从100亿美元快速跃升而来的,市场对DeepSeek的增长预期被推至极高水平。如果V4系列的商业化表现不及预期,如果后续模型迭代速度无法匹配竞争节奏,高估值不仅会引发资本市场的估值回调,更危险的是——期权价值缩水将直接导致人才的二次流失。届时,融资非但不能留人,反而会加速团队的瓦解。
这也是为何梁文锋选择自掏200亿元参与认购的深层逻辑——他需要用自己的“真金白银”为这个估值托底,向团队和市场传递一个明确信号:“我对公司的未来有绝对信心。”
写在最后:DeepSeek的融资,本质上是一道被现实逼迫的选择题。如果不融资,期权永远是“纸面财富”,核心人才将继续被大厂以2-3倍年薪精准收割,技术迭代节奏将继续被打乱。如果融资,资本带来的商业化压力、人才竞争内卷、治理文化稀释等风险将如影随形。
短期看,融资是有效的“止血剂”。450亿美元估值让期权有了市场价格,梁文锋自掏200亿元托底传递了信心,270人核心团队有望被稳住。但融资从来不是长效药——OpenAI融资后高管动荡的教训就在眼前。
DeepSeek的核心考验,不在于这一轮融了多少钱、拿到了多高估值,而在于融资之后,它能否做到两件事:第一,在资本的压力下守住技术初心,不让“纯研究”沦为“赚钱工具”;第二,构建一套“薪酬+理想+成长”的复合留人体系,让员工不只为钱留下,更为“这里能做别处做不了的研究”而留下。
从“不融资”到“450亿估值”,DeepSeek迈出了关键的一步。但这一步通向的是“技术理想与资本共赢”的新范式,还是“理想被资本绑架”的老结局?答案需要时间来书写。唯一确定的是:在中国AI大模型从追赶走向引领的历史关口,DeepSeek的这场实验,不仅关乎一家公司的命运,更关乎整个行业的走向——当技术理想主义遭遇资本的引力场,是理想重塑了资本,还是资本驯化了理想?
