专题链接

学术看板 当前位置:网站首页 > 专题链接 > 学术看板

机器学习与人工智能讲坛:面向物理世界强化学习的一些研究进展

作者:统计机器智能与学习实验室 来源:统计机器智能与学习实验室 阅读次数:268日期:2018/10/10

一、主题:面向物理世界强化学习的一些研究进展
二、主讲人:俞扬副教授  南京大学

三、时间:2018年10月15日上午10:00
四、地点:清水河校区宾诺咖啡

五、主持人:徐增林 计算机科学与工程学院教授 国家“青年千人”计划入选者

六、内容简介:

强化学习旨在通过环境交互来学习最优策略,在计算机围棋、Atari等游戏上获得成功,是实现自主智能的主要途径之一,最近受到高度关注。由于面临未知环境,经典强化学习需要不断地探索环境、在环境中试错,从而学习高回报策略,因此依赖大量自主环境交互数据。从现有成功案例来看,强化学习突出表现的案例仍以虚拟环境为主,例如游戏、棋类等,可在计算机中高速推演来快速获得百万级以上的数据。而在物理环境中进行强化学习,产生如此大量的数据将造成高昂的时间和经济开销,因此在现实应用中发挥强化学习的能力还面临很大的障碍。为促进强化学习在现实应用中落地,我们尝试从多个角度提高强化学习方法的样本利用效率、降低样本需求,并在真实的商品推荐应用、以及大规模游戏星际争霸II上进行了尝试。

七、主讲人简介:

俞扬,博士,南京大学副教授。主要研究领域为机器学习、强化学习,目前研究集中于提升强化学习样本利用效率。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。2011年8月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。发表论文40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS等,获得5项国际论文和竞赛奖,入选2018年IEEE Intelligent Systems杂志评选的AI's 10 to Watch,获2018 PAKDD Early Career Award,受邀在IJCAI’18作关于强化学习的Early Career 报告。

八、主办单位:计算机科学与工程学院

     承办单位:统计机器智能与学习实验室(SMILE Lab)

                                                                                                                                                                                   2018年10月10日