阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

阿里通义千问发布迄今最大模型——Qwen3-Max-Preview

《科创板日报》6日讯,《科创板日报》记者获悉,阿里巴巴旗下通义千问已推出Qwen3-Max-Preview(Instruct),参数量达到1T,为其迄今为止最大的模型,在中英文理解、复杂指令遵循、工具 … Continue reading 阿里通义千问发布迄今最大模型——Qwen3-Max-Preview