4月7日,阿里通义实验室智能计算团队宣布推出新算法FIPO(Future-KL Influenced Policy Optimization),引入Future-KL机制,奖励关键Token,解决纯强 … Continue reading 阿里通义实验室智能计算团队推出新算法FIPO
标签: 强化学习
腾讯混元新模型计划4月对外推出
财联社3月18日电,腾讯高管3月18日在财报发布后的媒体会上透露,HY 3.0正在内部业务测试中,计划在4月对外推出。这是一次混元模型的重大升级,相比HY2.0版本效果进步明显,推理和agent能力有 … Continue reading 腾讯混元新模型计划4月对外推出
智谱发布GLM-5技术报告 技术细节全公开
财联社2月22日电,据智谱官微消息,智谱推出了 GLM-5,这是一款旨在推动编程范式从“Vibe Coding”(氛围编程)转向“Agentic Engineering”(智能体工程)的下一代基础模型 … Continue reading 智谱发布GLM-5技术报告 技术细节全公开
获10亿美元种子轮融资!前DeepMind首席科学家离职创业:绕过大模型探索超级智能
快科技2月20日消息,据媒体报道,日前,前谷歌DeepMind首席科学家、AlphaGo核心负责人席尔瓦正式离职,并在伦敦创立AI初创公司Ineffable Intelligence。 近日,该公司正 … Continue reading 获10亿美元种子轮融资!前DeepMind首席科学家离职创业:绕过大模型探索超级智能
蚂蚁开源万亿参数强化学习高性能权重交换框架Awex
每经AI快讯,11月20日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。
蚂蚁开源万亿参数强化学习高性能权重交换框架Awex
11月20日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。据介绍,今年10月,蚂蚁集团开源了两款万亿参数旗舰模型,包括非思考的Ling-1T和思考模型Ring-1T。其中Ring-1T … Continue reading 蚂蚁开源万亿参数强化学习高性能权重交换框架Awex
智元机器人真机强化学习落地;云深处科技更名“股份有限公司”|数智早参
每经记者:杨煜 每经编辑:董兴生 丨 2025年11月4日 星期二 丨 NO.1 智元机器人真机强化学习落地 智元机器人宣布其研发的真机强化学习技术已在与龙旗科技合作的验证产线中成功落地,标志着该技术 … Continue reading 智元机器人真机强化学习落地;云深处科技更名“股份有限公司”|数智早参
智元机器人:真机强化学习落地工业产线
11月3日,智元机器人宣布,其研发的真机强化学习技术,已在与龙旗科技合作的验证产线中成功落地。
智元机器人与龙旗科技合作落地真机强化学习技术
每经AI快讯,11月3日,据智元机器人官微消息,智元机器人宣布其研发的真机强化学习技术已在与龙旗科技合作的验证产线中成功落地,标志着该技术首次从学术论文走向工业应用。这项技术突破解决了精密制造产线的刚 … Continue reading 智元机器人与龙旗科技合作落地真机强化学习技术
科大讯飞:已完成MoE和强化学习等算法在昇腾算力上的适配优化
财联社9月29日电,科大讯飞在互动平台表示,科大讯飞研发团队在各类芯片适配优化工作上具备丰富的工程实践经验,面对新算法和新架构,讯飞会持续联合国内芯片厂商团队开展攻关优化,当前已经完成MoE和强化学习 … Continue reading 科大讯飞:已完成MoE和强化学习等算法在昇腾算力上的适配优化
