斯坦福 CS234 强化学习
课程名称: Reinforcement Learning
官方入口: 课程主页、Stanford ExploreCourses
课程层级: 本研共修
先修要求: 概率、线性代数、一门机器学习课
重要程度: ※※※※※
课程定位
CS234 是 Stanford 强化学习主课,负责把智能体、环境、奖励、策略和价值函数这套 RL 基本语言讲扎实。它非常适合作为从 CS221、CS229 过渡到序贯决策和控制学习的第一门 RL 课。
核心内容
- MDP、策略评估与价值迭代
- 动态规划、蒙特卡洛与时序差分学习
- 策略梯度、Actor-Critic
- 探索、样本效率与函数逼近
- 深度强化学习基础
课程价值
很多人学 RL 时会直接被环境、算法和实验细节淹没,而 CS234 的长处在于把 RL 的问题定义、算法族谱和推导逻辑讲得比较 系统。
学完后的衔接
- 深度 RL:接
CS224R - 决策与不确定性:配合
CS228 - 机器人:接
CS237A