MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五

10月31日,上海AI独角兽MiniMax发布全新升级的语音模型Speech 2.6和音乐模型Music 2.0。其中,Music 2.0能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲,单首时 … 继续阅读 MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五

智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作

《科创板日报》30日讯,今日,智源发布多模态世界大模型 Emu3.5,以自回归方式实现了对多模态序列的“Next-State Prediction (NSP)”,获得了可泛化的世界建模能力。在场景应用 … 继续阅读 智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作