9月30日消息,蚂蚁集团研发的首个万亿参数大模型“Ring-1T-preview”在Hugging Face上线,该模型是一款自然语言推理大模型。此次发布的Ring-1T预览版在AIME 25测试中取 … Continue reading 蚂蚁开源万亿参数推理大模型
标签: 深度思考模型
阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写
财联社9月24日电,阿里巴巴发布通义全模态预训练大模型Qwen3-Omni系列模型。在36个音视频基准测试中,Qwen3-Omni系列模型有22项达到SOTA水平,其中32项取得开源模型最佳效果,语音 … Continue reading 阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写
DeepSeek发布V3.1终极版
每经AI快讯,22日晚间,DeepSeek宣布DeepSeek-V3.1 已更新至 DeepSeek-V3.1-Terminus (终极)版本。新版本在保持V3.1模型原有能力的基础上,针对用户反馈的 … Continue reading DeepSeek发布V3.1终极版
小米汽车公布三维场景感知专利
天眼查App显示,近日,小米汽车科技有限公司申请的“一种三维场景感知方法、装置、电子设备以及存储介质”专利公布。 摘要显示,本专利涉及自动驾驶技术领域,所述三维场景感知方法包括:获取车辆周围环境的多个 … Continue reading 小米汽车公布三维场景感知专利
宇树开源UnifoLM-WMA-0
9月15日,宇树宣布开源UnifoLM-WMA-0。UnifoLM-WMA-0是宇树科技跨多类机器人本体的开源世界模型-动作架构,专为通用机器人学习而设计,其核心成分在于一个可以理解机器人与环境交互物 … Continue reading 宇树开源UnifoLM-WMA-0
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
腾讯混元将发布原生多模态图像生成模型
9月9日晚间,腾讯混元最新的生图模型“混元图像2.1(HunyuanImage 2.1)”正式发布,支持最长达1000个tokens的提示词,支持原生2K生图。此外,腾讯混元方面透露,“混元原生多模态 … Continue reading 腾讯混元将发布原生多模态图像生成模型
字节跳动发布Seedream 4.0 图像创作从文生图进入多模态交互新阶段
每经北京9月9日电(记者李宇彤)9月9日,字节跳动Seed团队宣布推出豆包图像创作模型Seedream 4.0。据介绍,该模型支持文生图、图像编辑及多图参考等功能,具备多模态生图效果。Seedream … Continue reading 字节跳动发布Seedream 4.0 图像创作从文生图进入多模态交互新阶段
通义千问发布Qwen3-Max-Preview,参数量超1万亿
每经AI快讯,9月6日,阿里巴巴旗下通义千问Qwen上线新模型 Qwen3-Max-Preview (Instruct),“这是我们迄今为止最大的模型,参数量超1万亿!”据介绍,Qwen3-Max-P … Continue reading 通义千问发布Qwen3-Max-Preview,参数量超1万亿
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
《科创板日报》6日讯,《科创板日报》记者获悉,阿里巴巴旗下通义千问已推出Qwen3-Max-Preview(Instruct),参数量达到1T,为其迄今为止最大的模型,在中英文理解、复杂指令遵循、工具 … Continue reading 阿里通义千问发布迄今最大模型——Qwen3-Max-Preview