哈佛 CS184 强化学习简介

课程名称： Introduction to Reinforcement Learning
课程官网地址：2018年春
先修课程： 无
重要程度： ※※※※※
课程评点：

课程说明

现代人工智能系统通常需要能够在未知的、不确定的、可能是敌对的环境中做出顺序决策，方法是主动与环境交互以收集相关数据。强化学习 (RL) 是一个通用框架，可以捕获交互式学习设置，并已用于设计智能代理，以在围棋、计算机游戏、机器人操作、医疗保健和教育等具有挑战性的应用中实现高水平性能。

本课程介绍强化学习，涵盖一系列问题公式、算法和理论。该课程的四个主题是 (1) 多臂老虎机（最佳手臂识别、UCB、上下文老虎机、线性老虎机）(2) 马尔可夫决策过程（贝尔曼方程/最优性、规划、UCB、未知环境、有限/无限地平线问题）（3）大规模系统的方法（策略梯度方法，深度强化学习）（4）选择了更多的主题（线性二次调节器，汤普森抽样，可证明有效的探索，离线强化学习，模仿学习）。这些作业将侧重于算法和统计原理的组合，以及它们的编程实现。

哈佛 CS184 强化学习简介

课程说明​

课程说明