Token经济学:当“词元”成为结算单位,AI产业链在发生什么?

4月24日,DeepSeek V4新模型刷屏科技圈。百万字上下文、Agent自主调用、代码生成能力大幅提升——技术参数之外,一个更底层的信号被放大:AI的工作量正在被一个精确的单位所计量。

你和AI聊的每一句话,可能都在被”计价”。

让它写一篇文章,是Token;让它生成一段视频,是Token;让它做完一个表格再发送同事邮箱,还是Token。当大模型开始处理百万字长文档,当Agent能够连续调用工具、自主完成任务,一个更现实的问题开始浮出水面:AI是按什么标准”收费”的?AI产业链上的价值分配,又将如何被重构?

一、Token为何成为AI经济的”硬通货”?

承接开头的追问——AI到底按什么标准”收费”?答案已经越来越清晰:Token正在从后台的技术参数,蜕变为前台产业的”结算单位”。

这一转变的信号,意味着产业定价逻辑有望迎来从”价格战”到”涨价潮”的逆转。2024年厂商把Token单价压至”厘”级,用补贴换用户增长;2026年,云厂商开始在AI算力、存储及部分模型调用服务上陆续调价。 更值得关注的是,价格调整并未削弱需求侧热度:据公开报道,阿里云百炼平台今年一季度Token消耗量增长6倍,中国日均Token调用量突破140万亿,较2024年初增长超千倍。

这种”涨价放量”的现象说明,Token正在蜕变成为”硬通货”。正如工业时代的”千瓦时”、互联网时代的”流量”,Token正在成为AI经济的通用度量衡。国家数据局在2026年3月明确将其定义为智能时代的”结算单位”。

当前,一种全新的AI产业发展蓝图被提出,并正在逐步形成共识:AI产业架构可以拆分为”五层蛋糕”(能源、芯片、基础设施、模型、应用),贯穿其中的统一计量单位正是Token——这一现代生成式AI的基本单位,也是AI的”语言和货币”。“五层蛋糕”回答”在产业链哪里能赚到钱”,Token回答”用什么单位来计算效率、成本和收入”。

图:《AI是一个五层蛋糕》图示

信息来源:根据英伟达官方博客翻译绘制

二、当Token开始计价,产业链的三层分工如何演变?

Token消耗量的爆发,不是单点事件,而是一场沿着产业链层层传导的连锁反应。

(1)第一层:Token生产层——数据中心从”仓库”变为”工厂”

每一枚Token的生成都离不开实实在在的硬件支撑:GPU负责计算,存储芯片负责缓存,光模块负责数据传输,液冷设备负责散热。研究机构IDC预测,到2030年,全球年度Token消耗量或较2025年增长超过3亿倍,显示AI应用扩张对算力基础设施的拉动正在快速放大。

这种近乎指数级的消耗,正在重塑数据中心的角色。传统意义上的数据中心主要用于数据的静态存储,被视为”电子仓库”;如今,在电力和空间资源的硬约束下,数据中心全面转变为持续吞吐海量数据并输出智能内容的”电子工厂”。行业竞争的核心指标也从服务器数量、存储容量,转向每瓦特电力带来的Token吞吐量。

这直接推高了上游硬件的景气度:高端GPU产能被长期订单锁定,存储芯片价格翻倍,光模块出货量持续超预期。上游硬件的订单量和产能利用率,成为观察Token经济温度的先行指标。

(2)第二层:Token分发层——平台掌握定价权,商业模式分层

如果把上游算力比作”原材料”,那云平台和大模型厂商就是”加工厂”和”调度中心”——它们把底层算力加工成以Token计价的智能服务,再输送给下游。

这一环节的商业模式正在发生怎样的质变?目前Token经济中已经出现了三种截然不同的收费模式:第一种是按量计费,用多少收多少,简单透明;第二种是包月订阅,用户不再纠结单次成本,核心在于培养使用习惯;第三种是按价值收费,不按消耗了多少Token计价,而按创造了多少价值计价。

当Token变成按量计费的”硬通货”,掌握模型能力与云基础设施的厂商,实际上掌握了Token经济的定价中枢。

(3)第三层:Token应用层——从”人用AI”到”AI用AI”

Token经济的终极驱动力,永远来自真实场景的使用需求。过去两年,需求增长主要靠C端用户习惯养成和企业级应用嵌入,但这两者都有一个共同天花板——人的注意力是有限的。

2025年底开始,智能体(Agent)改变了这一格局。智能体不是聊天机器人,而是能自主执行任务的AI程序:给它一个目标,它自己搜索、比较、执行,整个过程中持续调用大模型、消耗Token,完全不需要人类参与。Token需求的下一波暴涨,正从”人用得更多”转向”机器自己开始消费”。

互联网平台也在经历从”接入AI”到”依赖AI”的深度转变。阿里千问接入淘宝、高德、支付宝,钉钉AI助理自动处理审批与会议;腾讯混元通过微信、企业微信落地,用户可直接调用Agent完成跨应用任务;快手、哔哩哔哩借助AI优化广告效率和内容分发。 这些平台不再把AI当作功能插件,而是将其嵌入核心业务流程,成为Token的最终消费主体。

三、Token放量加速期:国产模型迭代如何打开投资观察窗口?

2026年以来,国产模型进入高频迭代期:DeepSeek发布V4,字节跳动推出豆包2.0,智谱发布GLM-5,阿里开源Qwen3.6系列,腾讯开源混元3D世界模型2.0。核心方向高度一致——通过架构优化降低推理成本,通过多模态能力拓展应用场景,扩大生态覆盖。

对投资而言,这意味着一条清晰的传导链条:模型能力越强,可用场景越广,Token调用量越庞大,产业链景气度就越可持续。摩根大通预测,中国AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿,五年增长约370倍。Token消耗扩张正成为观察AI需求兑现和产业链景气度的重要线索,直接利好三大类资产:

一是”底座”硬科技。 Token消耗每上一个台阶,最先受益的是算力基础设施。GPU、存储芯片、光模块、液冷设备的订单量和产能利用率,是观察Token经济温度的先行指标。

二是”分发”平台。 当Token成为按量计费的”硬通货”,掌握模型能力与云基础设施的厂商掌握了定价中枢。AI云收入增速和商业化率提升,是验证其定价权的关键数据。

三是”应用”平台。 当AI从功能插件变成核心业务流程,平台成为Token的最终消费主体。AI对广告效率、电商转化、内容分发的提升幅度,决定了Token能否真正转化为收入。

从投资观察角度,四个指数化工具可分别对应Token经济的不同环节:

人工智能ETF易方达(159819)聚焦A股算力芯片、光模块、服务器等上游硬科技底座,对应Token”生产层”;

中概互联网ETF易方达(513050)覆盖海外上市的互联网龙头,既掌握Token分发环节的定价权,也深度参与应用层的Token消费;

港股通互联网ETF易方达(513040)覆盖港股通范围内的互联网及科技成长标的,兼具Token分发平台的定价中枢属性与应用层扩散机会;

港股通信息技术ETF易方达(159196)聚焦港股AI算力与应用标的,实现港股AI全产业链布局。

四者各有侧重、互为补充,共同构成从”生产”到”应用”的Token经济全景图谱。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平