强化学习连续动作问题(大讲堂强化学习的鲁棒性问题)
分享主题
鲁棒强化学习
分享背景
强化学习算法依赖大量采样的特性决定了需要首先在仿真环境中训练智能体策略再迁移到现实系统中。因此当仿真环境和现实系统出现不匹配时,策略的鲁棒性是影响强化学习算法能否实用的关键因素。本次公开课中,讲者将介绍华为伦敦研究所决策与推理团队在鲁棒强化学习方面的相关工作。
分享嘉宾
任航,伦敦帝国理工学院博士,任职于华为诺亚方舟实验室伦敦
分享提纲
-
华为伦敦研究所决策与推理团队介绍
-
强化学习的相关背景知识与强化学习的鲁棒性问题
-
Wasserstein Robust Reinforcement Learning 论文解读
分享时间
(北京时间 ) 10月 10 日(星期四) 20:00
雷锋网雷锋网雷锋网
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com