每经北京12月5日电(记者李宇彤)12月5日,火山引擎正式发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合专家大语言模型架构构建。 据官方介绍,2.0版本模型推理 … Continue reading 豆包发布语音识别模型2.0,支持多模态视觉识别和13种海外语种识别
标签: 语音识别
豆包输入法正式上线
豆包输入法正式上线,提供语音输入及键盘输入两种方式。基于豆包App同款语音模型,豆包输入法在语音识别和语义理解方面进一步提升,支持多种方言、英语及中英混合输入,并具备自动纠错功能;键盘输入也支持自动纠 … Continue reading 豆包输入法正式上线
AI应用关键一环!工信部助推这一行业发展 提出三个“下功夫”
《科创板日报》11月19日讯(编辑 宋子乔) 我国既是玩具生产大国,又是玩具消费、出口大国。当前,我国正在大力推进人工智能+行动,积极推动培育智能产品生态,AI玩具已成为消费新潮流。 工业和信息化部1 … Continue reading AI应用关键一环!工信部助推这一行业发展 提出三个“下功夫”
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
11 月 11 日消息,Meta 基础人工智能研究(FAIR)团队推出了“全语种自动语音识别系统”(Omnilingual ASR),该系统可支持 1600 多种语言的语音转写,大幅拓展了当前语音识别 … Continue reading 打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
科大讯飞发布一系列“大模型落地”进展,国产算力是最好的解法吗?
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 11月6日,科大讯飞举行2025年1024开发者节发布会。 与行业当前普遍强调模型能力和应用生态类似,科大讯飞同样围绕“大模型落地”展开叙事,推出了基 … Continue reading 科大讯飞发布一系列“大模型落地”进展,国产算力是最好的解法吗?
年入2.5亿美元的AI硬件“黑马”Plaud回归国内,能否复刻海外增长?
在AI(人工智能)硬件赛道竞争白热化的2025年,成立不到三年、总部位于深圳的Plaud预计2025年总收入将达到2.5亿美元,并且,其AI纪要产品覆盖170个国家,出货量已超100万台。 “刚开始主 … Continue reading 年入2.5亿美元的AI硬件“黑马”Plaud回归国内,能否复刻海外增长?
QQ浏览器电脑端上线“实时字幕”功能,支持16种语言
9月9日,QQ浏览器电脑端“实时字幕”功能上线,依托腾讯云智能服务ASR(自动语音识别)和腾讯混元翻译模型,支持16种语言。
阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini
9月1日,阶跃星辰正式发布开源端到端语音大模型Step-Audio 2 mini。它将语音理解、音频推理与生成统一建模,在音频理解、语音识别、跨语种翻译、情感与副语言解析、语音对话等任务中表现突出,并 … Continue reading 阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini
钉钉联合通义推出 Fun-ASR语音识别大模型
钉钉联合通义推出Fun-ASR语音识别大模型
据钉钉黑板报消息,8月22日,钉钉、通义实验室语音团队宣布,联手推出新一代语音识别大模型 Fun-ASR,能听懂家装、畜牧等十大行业黑话,并支持企业专属模型定制训练。
