Skip to main content

斯坦福 CS234 强化学习

课程名称: Reinforcement Learning
官方入口: 课程主页Stanford ExploreCourses
课程层级: 本研共修
先修要求: 概率、线性代数、一门机器学习课
重要程度: ※※※※※

课程定位

CS234 是 Stanford 强化学习主课,负责把智能体、环境、奖励、策略和价值函数这套 RL 基本语言讲扎实。它非常适合作为从 CS221CS229 过渡到序贯决策和控制学习的第一门 RL 课。

核心内容

  • MDP、策略评估与价值迭代
  • 动态规划、蒙特卡洛与时序差分学习
  • 策略梯度、Actor-Critic
  • 探索、样本效率与函数逼近
  • 深度强化学习基础

课程价值

很多人学 RL 时会直接被环境、算法和实验细节淹没,而 CS234 的长处在于把 RL 的问题定义、算法族谱和推导逻辑讲得比较系统。

学完后的衔接

  • 深度 RL:接 CS224R
  • 决策与不确定性:配合 CS228
  • 机器人:接 CS237A