DeepSeek V4下周上线?原生多模态架构 技术报告同步开放

《科创板日报》3月1日讯(编辑 宋子乔) 当地时间2月28日,据金融时报报道,DeepSeek将于下周发布其最新的大模型V4。 据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在 … Continue reading DeepSeek V4下周上线?原生多模态架构 技术报告同步开放

DeepSeek团队联合清北发布DualPath系统,打破智能体推理存储瓶颈

近日,DeepSeek团队联合清华大学、北京大学计算机学院发表名为《DualPath:突破智能体LLM推理中的存储带宽瓶颈》的论文。针对智能体LLM推理中的KV-Cache存储瓶颈,论文提出DualP … Continue reading DeepSeek团队联合清北发布DualPath系统,打破智能体推理存储瓶颈

中国AI模型调用量首超美国,专家:技术路线是降低推理成本的核心原因之一

每经记者:宋欣悦 每经编辑:高涵 每经讯,全球最大的AI模型API聚合平台OpenRouter数据显示,2026年2月9日至15日当周,中国模型的调用量为4.12万亿Token,首次超过美国模型(2. … Continue reading 中国AI模型调用量首超美国,专家:技术路线是降低推理成本的核心原因之一

阿里发布新一代基模千问3.5,每百万Token低至0.8元

《科创板日报》2月16日讯(记者 黄心怡)除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降 … Continue reading 阿里发布新一代基模千问3.5,每百万Token低至0.8元