百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking开源

11月11日,百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking正式开源。本模型仅3B激活参数。此外,百度引入了“图像思考”创新能力,让本模型兼备图片放大和图片搜索等工具 … Continue reading 百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking开源

MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五

10月31日,上海AI独角兽MiniMax发布全新升级的语音模型Speech 2.6和音乐模型Music 2.0。其中,Music 2.0能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲,单首时 … Continue reading MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五

智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作

《科创板日报》30日讯,今日,智源发布多模态世界大模型 Emu3.5,以自回归方式实现了对多模态序列的“Next-State Prediction (NSP)”,获得了可泛化的世界建模能力。在场景应用 … Continue reading 智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作