Skip to main content

斯坦福 CS234 强化学习

课程名称： Reinforcement Learning
官方入口： 课程主页、Stanford ExploreCourses
课程层级： 本研共修
先修要求： 概率、线性代数、一门机器学习课
重要程度： ※※※※※

课程定位

CS234 是 Stanford 强化学习主课，负责把智能体、环境、奖励、策略和价值函数这套 RL 基本语言讲扎实。它非常适合作为从 CS221、CS229 过渡到序贯决策和控制学习的第一门 RL 课。

核心内容

MDP、策略评估与价值迭代
动态规划、蒙特卡洛与时序差分学习
策略梯度、Actor-Critic
探索、样本效率与函数逼近
深度强化学习基础

课程价值

很多人学 RL 时会直接被环境、算法和实验细节淹没，而 CS234 的长处在于把 RL 的问题定义、算法族谱和推导逻辑讲得比较系统。

学完后的衔接

深度 RL：接 CS224R
决策与不确定性：配合 CS228
机器人：接 CS237A

课程定位
核心内容
课程价值
学完后的衔接