蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

11月20日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。据介绍,今年10月,蚂蚁集团开源了两款万亿参数旗舰模型,包括非思考的Ling-1T和思考模型Ring-1T。其中Ring-1T … Continue reading 蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

智元机器人真机强化学习落地;云深处科技更名“股份有限公司”|数智早参

每经记者:杨煜 每经编辑:董兴生 丨 2025年11月4日 星期二 丨 NO.1 智元机器人真机强化学习落地 智元机器人宣布其研发的真机强化学习技术已在与龙旗科技合作的验证产线中成功落地,标志着该技术 … Continue reading 智元机器人真机强化学习落地;云深处科技更名“股份有限公司”|数智早参

智元机器人与龙旗科技合作落地真机强化学习技术

每经AI快讯,11月3日,据智元机器人官微消息,智元机器人宣布其研发的真机强化学习技术已在与龙旗科技合作的验证产线中成功落地,标志着该技术首次从学术论文走向工业应用。这项技术突破解决了精密制造产线的刚 … Continue reading 智元机器人与龙旗科技合作落地真机强化学习技术

科大讯飞:已完成MoE和强化学习等算法在昇腾算力上的适配优化

财联社9月29日电,科大讯飞在互动平台表示,科大讯飞研发团队在各类芯片适配优化工作上具备丰富的工程实践经验,面对新算法和新架构,讯飞会持续联合国内芯片厂商团队开展攻关优化,当前已经完成MoE和强化学习 … Continue reading 科大讯飞:已完成MoE和强化学习等算法在昇腾算力上的适配优化

阿里巴巴宣布与英伟达开展Physical AI合作

《科创板日报》24日讯,在2025阿里云栖大会上,阿里巴巴正式宣布与英伟达开展Physical AI合作。合作覆盖了Physical AI的实践的各个方面,包括数据的合成处理,模型的训练,环境仿真强化 … Continue reading 阿里巴巴宣布与英伟达开展Physical AI合作

百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

快科技9月9日消息,今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心 … Continue reading 百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

推荐系统(10)—— 进化算法、强化学习

1、进化策略(ES:evolution strategy)   在一定的抽象程度上,进化方法可被视为这样一个过程:从个体构成的群体中采样并让其中成功的个体引导未来后代的分布。但是,其数学细节在生物进化 … Continue reading 推荐系统(10)—— 进化算法、强化学习