跳到主要内容

哈佛 CS184 强化学习简介

课程名称: Introduction to Reinforcement Learning
课程官网地址:2018年春
先修课程:
重要程度: ※※※※※
课程评点:

课程说明

现代人工智能系统通常需要能够在未知的、不确定的、可能是敌对的环境中做出顺序决策,方法是主动与环境交互以收集相关数据。强化学习 (RL) 是一个通用框架,可以捕获交互式学习设置,并已用于设计智能代理,以在围棋、计算机游戏、机器人操作、医疗保健和教育等具有挑战性的应用中实现高水平性能。

本课程介绍强化学习,涵盖一系列问题公式、算法和理论。该课程的四个主题是 (1) 多臂老虎机(最佳手臂识别、UCB、上下文老虎机、线性老虎机)(2) 马尔可夫决策过程(贝尔曼方程/最优性、规划、UCB、未知环境、有限/无限地平线问题)(3)大规模系统的方法(策略梯度方法,深度强化学习)(4)选择了更多的主题(线性二次调节器,汤普森抽样,可证明有效的探索,离线强化学习,模仿学习)。这些作业将侧重于算法和统计原理的组合,以及它们的编程实现。