DeepSeek-V3.2-Exp发布并开源 《科创板日报》29日讯,《科创板日报》记者注意到,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。(记者 黄心怡) Published by 风君子 独自遨游何稽首 揭天掀地慰生平 View all posts by 风君子