小米MiMo-V2.5语音模型正式发布:一句话生成声音、克隆真人音色

快科技4月24日消息,今日,小米正式发布MiMo-V2.5语音模型,带来MiMo-V2.5-TTS系列与MiMo-V2.5-ASR。 这是一套面向Agent时代的全链路语音模型系列,覆盖识别与合成两大 … Continue reading 小米MiMo-V2.5语音模型正式发布:一句话生成声音、克隆真人音色

阿里通义千问 Qwen3-TTS 语音合成 AI 模型发布:超 49 种音色,支持多种方言

12 月 10 日消息,阿里通义千问今日发布 Qwen3-TTS,这是一款支持多音色、多语种和多方言的语音合成 AI 模型,目前可通过 Qwen API 访问。 附 Qwen3-TTS 主要改进内容如 … Continue reading 阿里通义千问 Qwen3-TTS 语音合成 AI 模型发布:超 49 种音色,支持多种方言

小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型

9月12日,据小米技术消息,近日,小米集团AI实验室新一代Kaldi团队发布了基于Flow Matching架构的ZipVoice系列语音合成(TTS)模型——ZipVoice(零样本单说话人语音合成 … Continue reading 小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型