强化学习相关文章列表

马斯克宣布Grok V9-Medium完成训练：两到三周内发布

每经AI快讯，5月25日，马斯克在其X账号上宣布Grok 基础模型 V9-Medium (1.5T) 已完成训练，评估结果良好。目前正在进行微调…

2026年5月25日

业界

小红书开源大模型强化学习训练引擎Relax

4月15日，小红书AI平台团队正式开源Relax——一款面向全模态与Agentic场景设计的大模型强化学习训练引擎。据介绍，Relax支持图像、…

relax / 小红书 / 引擎 / 强化学习 / 模态 / 知名企业

2026年4月15日

业界

阿里通义实验室智能计算团队推出新算法FIPO

4月7日，阿里通义实验室智能计算团队宣布推出新算法FIPO（Future-KL Influenced Policy Optimization），…

fipo / 强化学习 / 算法 / 阿里通义

2026年4月7日

业界

腾讯混元新模型计划4月对外推出

财联社3月18日电，腾讯高管3月18日在财报发布后的媒体会上透露，HY 3.0正在内部业务测试中，计划在4月对外推出。这是一次混元模型的重大升级…

强化学习 / 推理 / 混元 / 知名企业 / 腾讯

2026年3月18日

业界

智谱发布GLM-5技术报告技术细节全公开

财联社2月22日电，据智谱官微消息，智谱推出了 GLM-5，这是一款旨在推动编程范式从“Vibe Coding”（氛围编程）转向“Agentic…

GLM / 上下文 / 大模型 / 强化学习 / 技术报告 / 技术细节 / 智谱 / 算法 / 编程

2026年2月22日

业界

获10亿美元种子轮融资！前DeepMind首席科学家离职创业：绕过大模型探索超级智能

快科技2月20日消息，据媒体报道，日前，前谷歌DeepMind首席科学家、AlphaGo核心负责人席尔瓦正式离职，并在伦敦创立AI初创公司Ine…

AI初创公司 / AI融资纪录 / DeepMind / 席尔瓦 / 席尔瓦离职 / 强化学习

2026年2月21日

业界

蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

每经AI快讯，11月20日，蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。

awex / 交换框架 / 强化学习 / 蚂蚁开源 / 蚂蚁集团

2025年11月20日

业界

蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

11月20日，蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。据介绍，今年10月，蚂蚁集团开源了两款万亿参数旗舰模型，包括非思考的L…

awex / 交换框架 / 强化学习 / 蚂蚁开源 / 高吞吐量内核

2025年11月20日

业界

智元机器人真机强化学习落地；云深处科技更名“股份有限公司”｜数智早参

每经记者：杨煜每经编辑：董兴生丨 2025年11月4日星期二丨 NO.1 智元机器人真机强化学习落地智元机器人宣布其研发的真机强化学习…

云深处科技 / 北方稀土 / 强化学习 / 数智早参 / 智元机器人 / 磁材

2025年11月4日

业界

智元机器人：真机强化学习落地工业产线

11月3日，智元机器人宣布，其研发的真机强化学习技术，已在与龙旗科技合作的验证产线中成功落地。

工业产线 / 强化学习 / 智元机器人 / 脑机接口产业

2025年11月3日

业界

马斯克宣布Grok V9-Medium完成训练：两到三周内发布

小红书开源大模型强化学习训练引擎Relax

阿里通义实验室智能计算团队推出新算法FIPO

腾讯混元新模型计划4月对外推出

智谱发布GLM-5技术报告技术细节全公开

获10亿美元种子轮融资！前DeepMind首席科学家离职创业：绕过大模型探索超级智能

蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

智元机器人真机强化学习落地；云深处科技更名“股份有限公司”｜数智早参

智元机器人：真机强化学习落地工业产线

2020最新自助免费申请Office365教育版，免费5TOneDrive云盘详细图文教程

MacBook怎么绕过BootCamp安装Win10双系统

上海电信千兆宽带速度究竟如何上海电信千兆宽带

国内知名的前端博客

域名为什么会被墙如何检测域名是否被墙域名被墙如何处理

标签： 强化学习

站内搜索

标签云

热门文章

友情链接

标签：强化学习