每经AI快讯,国金证券研报表示,人工智能交互范式正从单次问答转向自主Agent。OpenRouter数据显示多步骤推理快速取代单轮交互,OpenClaw框架以24.8万星标登顶GitHub。Agent任务Token消耗为对话模式的4~15倍,NVIDIA指出下一代AI工厂需支持数十万Token长上下文。自注意力机制计算成本与上下文长度呈二次方增长,KV Cache膨胀导致GPU利用率下降。多Agent协作引入通信开销,Gartner显示企业询盘量暴增1445%。杰文斯悖论下,效率提升反而刺激使用量更快增长,算力需求将持续非线性扩张。
