4月8日,DeepSeek上线专家模式,最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,这是DeepSeek走红以来首次在产品端引入模式分层设计。 《每日经济新闻》记者注意到,快 … Continue reading DeepSeek上线专家模式
标签: 推理
花旗:预计三星在下半年继续受益于持续的人工智能推理内存需求
财联社4月7日电,花旗集团分析师表示,三星电子很可能在2026年下半年受益于持续的人工智能推理内存需求。分析师在一份报告中写道,强劲的人工智能推理内存需求应能在整个2026年支撑三星的内存定价,尤其是 … Continue reading 花旗:预计三星在下半年继续受益于持续的人工智能推理内存需求
谷歌更新Gemini API定价 按推理使用分档计费
财联社4月3日电,谷歌近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priori … Continue reading 谷歌更新Gemini API定价 按推理使用分档计费
阶跃星辰上线Step 3.5 Flash新版本,新增低推理模式
4月2日,阶跃星辰宣布,最新模型Step 3.5 Flash 2603现已上线,新增low think mode,面向所有Step Plan用户开放。据介绍,测试数据显示,该模型在默认推理模式(hig … Continue reading 阶跃星辰上线Step 3.5 Flash新版本,新增低推理模式
从“词元”到“国产算力”:科创50为何是AI推理时代的更优解?
在近期举办的GTC 2026大会上,黄仁勋的一段话引发了市场深思。他指出,AI产业的重心正在从“训练模型”向“推理应用”转移,未来每一秒钟、每一次交互,背后都是海量Token的生成与消耗。而近期中国发 … Continue reading 从“词元”到“国产算力”:科创50为何是AI推理时代的更优解?
前阿里千问负责人林俊旸离职后首发长文:从训练模型转向训练智能体
财联社3月27日电,原阿里通义千问(Qwen)技术负责人林俊旸(Justin Lin)3月26日在社交平台上发布了一篇题为“From ‘Reasoning’ Thinking to‘Agentic’ … Continue reading 前阿里千问负责人林俊旸离职后首发长文:从训练模型转向训练智能体
开源证券:AI应用有望带动推理需求持续增长
每经AI快讯,开源证券指出,关注AI商业化及应用场景拓展,AI应用从Chat向Agent进化,有望带动推理深度与调用链路不断加长,从而带动底层Token消耗呈现数量级跃升;开源模型能力持续提升下,AI … Continue reading 开源证券:AI应用有望带动推理需求持续增长
中国AI大模型周调用量达4.69万亿Token
财联社3月22日电,全球最大AI模型API聚合平台OpenRouter最新发布的数据显示,截至3月15日,中国AI大模型的周调用量达到4.69万亿Token,连续第二周超越美国。全球调用量排名前三的位 … Continue reading 中国AI大模型周调用量达4.69万亿Token
阿里巴巴:已将自研的平头哥GPU大规模投入生产
财联社3月19日电,阿里巴巴表示,公司已将自主研发的平头哥GPU大规模投入生产,支持从训练、微调到推理的端到端AI工作负载。
腾讯混元新模型计划4月对外推出
财联社3月18日电,腾讯高管3月18日在财报发布后的媒体会上透露,HY 3.0正在内部业务测试中,计划在4月对外推出。这是一次混元模型的重大升级,相比HY2.0版本效果进步明显,推理和agent能力有 … Continue reading 腾讯混元新模型计划4月对外推出
