讲座:《强化学习简介及其应用》

2018-06-06

讲座:《强化学习简介及其应用

报告人:朱斐
报告人简介:朱斐,男,1978年1月生,博士,苏州大学计算机科学与技术学院副教授,中国计算机学会会员,中国运筹学会会员。2000年毕业于苏州大学,2016-2018年(美国加州大学圣地亚哥分校)、2010年(美国Troy大学)进行交流访问和合作研究。近年来,主持国家自然科学基金1项,作为主要成员参与国家自然科学基金项目5项,主持江苏省高校自然科学基金重大科研项目1项、江苏省高校自然科学基金面上项目1项、教育部重点实验室项目1项、江苏省重点实验室开放课题1项、苏州市工业应用基础项目1项,主持横向项目4项。主持苏州大学研究生教改项目1项,主持苏州大学本科教改项目多项,开设硕士生课程2门,获得较好教学效果,荣获苏州大学交行奖教金1次、苏州大学计算机科学与技术学院瑞翼奖教金1次。
一、讲座时间:2018年6月7日18:00-19:30
二、讲座地点:F102
三、讲座内容:强化学习(reinforcement learning, RL)受到动物心理学启发,是在心理学、控制理论等相关学科的发展中形成的一种机器学习算法。强化学习算法通过智能体(agent)与环境交互的不断“试错”学习,寻求累积奖赏最大的策略。强化学习在优化调度等领域表现尤为突出,已经得到大量的应用。在其他领域,如生物医学、游戏博弈,也取得了较佳的成果。
我们将从机器学习入手,介绍强化学习算法的基本框架、特点,分析强化学习的主要要素、结合实例讨论强化学习的优势接着介绍强化学习的一些应用和本团队取得的主要相关成果。
深度学习是近年来的一类方法。越来越多的人使用深度学习提炼特征。Google的DeepMind团队较早地将深度学习与强化学习相结合,形成了新的研究方向,即深度强化学习(deep reinforcement learning, DRL),开发出阿尔法狗系统,战胜世界围棋冠军。
深度强化学习包括了强化学习和深度学习两个部分,其中深度学习部分具有感知环境信息的功能;强化学习部分通过决策完成从状态到动作的映射,并在决策后获得奖赏。深度强化学习累积了一些研究工作。我们将分析深度强化学习的基本框架,介绍近来的一些主要研究成果和应用。
四、参加对象:工学院计算机类专业全体同学

欢迎其他感兴趣的同学旁听!
工学院
2018年6月6日