每经AI快讯,5月25日,马斯克在其X账号上宣布Grok 基础模型 V9-Medium (1.5T) 已完成训练,评估结果良好。目前正在进行微调,强化学习将于几天后开始。预计 2 至 3 周后正式发布 … Continue reading 马斯克宣布Grok V9-Medium完成训练:两到三周内发布
标签: 强化学习
小红书开源大模型强化学习训练引擎Relax
4月15日,小红书AI平台团队正式开源Relax——一款面向全模态与Agentic场景设计的大模型强化学习训练引擎。据介绍,Relax支持图像、音频、视频等输入的统一处理与灵活接入,结合模态感知并行与 … Continue reading 小红书开源大模型强化学习训练引擎Relax
阿里通义实验室智能计算团队推出新算法FIPO
4月7日,阿里通义实验室智能计算团队宣布推出新算法FIPO(Future-KL Influenced Policy Optimization),引入Future-KL机制,奖励关键Token,解决纯强 … Continue reading 阿里通义实验室智能计算团队推出新算法FIPO
腾讯混元新模型计划4月对外推出
财联社3月18日电,腾讯高管3月18日在财报发布后的媒体会上透露,HY 3.0正在内部业务测试中,计划在4月对外推出。这是一次混元模型的重大升级,相比HY2.0版本效果进步明显,推理和agent能力有 … Continue reading 腾讯混元新模型计划4月对外推出
智谱发布GLM-5技术报告 技术细节全公开
财联社2月22日电,据智谱官微消息,智谱推出了 GLM-5,这是一款旨在推动编程范式从“Vibe Coding”(氛围编程)转向“Agentic Engineering”(智能体工程)的下一代基础模型 … Continue reading 智谱发布GLM-5技术报告 技术细节全公开
获10亿美元种子轮融资!前DeepMind首席科学家离职创业:绕过大模型探索超级智能
快科技2月20日消息,据媒体报道,日前,前谷歌DeepMind首席科学家、AlphaGo核心负责人席尔瓦正式离职,并在伦敦创立AI初创公司Ineffable Intelligence。 近日,该公司正 … Continue reading 获10亿美元种子轮融资!前DeepMind首席科学家离职创业:绕过大模型探索超级智能
蚂蚁开源万亿参数强化学习高性能权重交换框架Awex
每经AI快讯,11月20日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。
蚂蚁开源万亿参数强化学习高性能权重交换框架Awex
11月20日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。据介绍,今年10月,蚂蚁集团开源了两款万亿参数旗舰模型,包括非思考的Ling-1T和思考模型Ring-1T。其中Ring-1T … Continue reading 蚂蚁开源万亿参数强化学习高性能权重交换框架Awex
智元机器人真机强化学习落地;云深处科技更名“股份有限公司”|数智早参
每经记者:杨煜 每经编辑:董兴生 丨 2025年11月4日 星期二 丨 NO.1 智元机器人真机强化学习落地 智元机器人宣布其研发的真机强化学习技术已在与龙旗科技合作的验证产线中成功落地,标志着该技术 … Continue reading 智元机器人真机强化学习落地;云深处科技更名“股份有限公司”|数智早参
智元机器人:真机强化学习落地工业产线
11月3日,智元机器人宣布,其研发的真机强化学习技术,已在与龙旗科技合作的验证产线中成功落地。
