斯坦福 CS231N 用于视觉识别的卷积神经网络
课程名称: Convolutional Neural Networks for Visual Recognition
官方入口: 课程主页、Stanford ExploreCourses
课程层级: 本研共修
先修要求: 机器学习、深度学习基础、线性代数、Python
重要程度: ※※※※※
课程定位
CS231N 是全球影响力最大的深度学习课程之一,也是很多人进入计算机视觉和现代神经网络的第一门硬核课。虽然名字里写的是视觉识别,但它讲到的很多网络结构、训练范式和工程经验已经成为整个深度学习社区的通用语言。
核心内 容
- CNN 基础、卷积结构与视觉归纳偏置
- 检测、分割、识别等视觉任务
- RNN、Transformer 和更一般的深度模型框架
- 训练技巧、优化、可视化与误差分析
- 深度学习研究中的实验设计与系统调试
为什么它不只是一门视觉课
很多人学完 CS231N 的最大收获并不是“会做图像分类”,而是第一次真正理解深度模型该如何组织实验、如何诊断问题、如何阅读现代 DL 论文。它是非常好的研究入门课。
学习难点
- 作业量大,工程实现要求高
- 默认你对深度学习基础已经比较熟
- 课程会很快进入现代模型和研究讨论,不适合零基础直接冲
学完后的衔接
- 视觉基础不足:先补
CS131、CS231A - 生成与多模态:可继续看
CS236与更近年的视觉 / 多模态专题