每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … 继续阅读 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
标签: 上下文
月之暗面宣布Kimi K2模型更新,上下文长度扩展至256K
9月5日,月之暗面发布Kimi K2模型的最新版本0905,扩展上下文长度至256K,支持高达60-100 Token/s的输出速度。Kimi应用和网页版中的K2模型已全量升级到0905最新版。
阿里云百炼宣布部分模型 上下文缓存降价
硅基流动:上线DeepSeek-V3.1,上下文升至160K
据硅基流动消息,8月25日,硅基流动大模型服务平台上线深度求索团队最新开源的DeepSeek-V3.1。DeepSeek-V3.1总参数共671B,激活参数37B,采用混合推理架构(同时支持思考模式与 … 继续阅读 硅基流动:上线DeepSeek-V3.1,上下文升至160K
DeepSeek线上模型版本升级至V3.1
DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。
DeepSeek线上模型版本升级至V3.1
每经AI快讯,8月19日,记者注意到,DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。
DeepSeek线上模型版本升级至 V3.1
《科创板日报》19日讯,《科创板日报》记者注意到,DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。(记者 黄心怡)
阿里通义千问:多个产品升级,Qwen-Image图片编辑模型即将上线
8月15日,通义千问宣布,Qwen3 100万tokens上下文再拓展、Qwen Chat Deep Reseache再升级、ComfyUI上线Qwen-Image distilled。此外,Qwen … 继续阅读 阿里通义千问:多个产品升级,Qwen-Image图片编辑模型即将上线
通义千问:多个产品升级,Qwen-Image图片编辑模型即将上线
8月15日,通义千问宣布,Qwen3 100万tokens上下文再拓展、Qwen Chat Deep Reseache再升级、ComfyUI上线Qwen-Image distilled。此外,Qwen … 继续阅读 通义千问:多个产品升级,Qwen-Image图片编辑模型即将上线
华为发布AI推理新技术 将于今年9月正式开源
《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产 … 继续阅读 华为发布AI推理新技术 将于今年9月正式开源
