2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模 … Continue reading DeepSeek-V3.2-Exp模型正式发布并开源
标签: 上下文
DeepSeek V3.2、GLM4.6等大模型即将发布
财联社9月29日电,DeepSeek-V3.2即将发布,据了解,v3.2-base已上传至DeepSeek的HuggingFace官方页面,模型文件正在上传中,不过目前已下线。同时,智谱GLM4.6也 … Continue reading DeepSeek V3.2、GLM4.6等大模型即将发布
马斯克:Grok Code下周将发布重大升级和修复
马斯克9月18日发文称,Grok Code将在下周发布许多重大升级和修复,包括1M上下文窗口。
硅基流动上线蚂蚁集团Ling-flash-2.0模型
9月18日,硅基流动大模型服务平台首发上线蚂蚁集团百灵团队最新开源的Ling-flash-2.0。硅基流动平台上线的Ling-flash-2.0支持128K最大上下文长度,价格为输入1元/M Toke … Continue reading 硅基流动上线蚂蚁集团Ling-flash-2.0模型
硅基流动上线腾讯混元翻译模型Hunyuan-MT-7B
每经AI快讯,9月17日消息,硅基流动大模型服务平台已上线腾讯混元团队最新开源的翻译模型 Hunyuan-MT-7B。这是硅基流动上线的第 129 个模型。该模型支持 33 个语种互译,支持 32K … Continue reading 硅基流动上线腾讯混元翻译模型Hunyuan-MT-7B
推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐
《科创板日报》9月13日讯 在AI浪潮中,模型参数增长和算力堆叠一度成为竞逐焦点。不过站在当下时点,当生成式AI开启规模化落地,战场已经转向推理:真实场景中海量数据的瞬间调用、百万Token的连续推理 … Continue reading 推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
月之暗面宣布Kimi K2模型更新,上下文长度扩展至256K
9月5日,月之暗面发布Kimi K2模型的最新版本0905,扩展上下文长度至256K,支持高达60-100 Token/s的输出速度。Kimi应用和网页版中的K2模型已全量升级到0905最新版。
阿里云百炼宣布部分模型 上下文缓存降价
硅基流动:上线DeepSeek-V3.1,上下文升至160K
据硅基流动消息,8月25日,硅基流动大模型服务平台上线深度求索团队最新开源的DeepSeek-V3.1。DeepSeek-V3.1总参数共671B,激活参数37B,采用混合推理架构(同时支持思考模式与 … Continue reading 硅基流动:上线DeepSeek-V3.1,上下文升至160K