每经AI快讯,据面壁智能微信公众号5月25日消息,面壁智能联合清华大学正式开源中国首个基于昇腾训练的低比特端侧大模型BitCPM-CANN,从量化算子、训练算法到全链路框架,BitCPM-CANN均在 … Continue reading 面壁智能联合清华正式开源中国首个基于昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
标签: 算子
壁仞科技:壁砺166系列完成DeepSeek-V4适配验证与优化
4月25日晚,壁仞科技宣布,完成DeepSeek-V4在旗舰通用GPU壁砺™166系列产品的适配验证与优化。壁仞科技本次适配聚焦DeepSeek-V4核心技术特性,围绕MoE架构、稀疏注 … Continue reading 壁仞科技:壁砺166系列完成DeepSeek-V4适配验证与优化
太初元碁完成DeepSeek-V4深度适配与协同优化
4月25日消息,国产AI芯片企业太初元碁基于其自研AI加速卡与SDAA软件栈,完成对DeepSeek-V4的深度快速适配与协同优化。据悉,针对DeepSeek-V4的mHC、Muon优化器等新架构特性 … Continue reading 太初元碁完成DeepSeek-V4深度适配与协同优化
摩尔线程TileLang-MUSA Day-0支持DeepSeek-V4全新TileKernels
4月24日,摩尔线程宣布,其基于TileLang 0.1.8版本深度优化并已成为TileLang官方主线版本的TileLang-MUSA,已率先在国产全功能GPU上,实现对DeepSeek-V4最新T … Continue reading 摩尔线程TileLang-MUSA Day-0支持DeepSeek-V4全新TileKernels
沐曦股份:联合上海人工智能实验室发布高性能GPU算子生成系统Kernel-Smith
4月3日,据沐曦股份消息,上海人工智能实验室和沐曦股份联合发布了高性能GPU算子生成系统——Kernel-Smith。据沐曦股份介绍,Kernel-Smith创新性地将“稳定评估驱动的进化智能体”与“ … Continue reading 沐曦股份:联合上海人工智能实验室发布高性能GPU算子生成系统Kernel-Smith
独家|海光信息DCU完成对智谱GLM-5的首发同步适配与联合精调
财联社2月11日电,智谱AI今日正式上线并开源GLM-5。财联社记者从海光信息方面获悉,海光DCU已同步完成对GLM-5的Day0适配(首发同步适配)与联合精调。海光信息方面表示,在本次Day0适配合 … Continue reading 独家|海光信息DCU完成对智谱GLM-5的首发同步适配与联合精调
腾讯混元AI Infra核心技术开源
2月4日,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库HPC-Ops。腾讯混元称,在真实场景下,基于HPC-Ops,混元模型推理QPM提升30%,DeepSeek模型QPM … Continue reading 腾讯混元AI Infra核心技术开源
腾讯混元AI Infra核心技术开源:推理吞吐提升30%
财联社2月4日电,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 Q … Continue reading 腾讯混元AI Infra核心技术开源:推理吞吐提升30%
DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
《科创板日报》9月29日讯(记者 黄心怡)梁文锋最新动作来了,DeepSeek-V3.2-Exp 今天正式发布并开源。 根据DeepSeek官方介绍,这是一个实验性(Experimental)的版本, … Continue reading DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
DeepSeek-V3.2-Exp模型发布并开源,API价格大幅下调
9月29日,DeepSeek-V3.2-Exp模型正式发布,并已在Huggingface与魔搭开源。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降 … Continue reading DeepSeek-V3.2-Exp模型发布并开源,API价格大幅下调
