斯坦福 CS231N 用于视觉识别的卷积神经网络

课程名称： Convolutional Neural Networks for Visual Recognition
官方入口： 课程主页、Stanford ExploreCourses
课程层级： 本研共修
先修要求： 机器学习、深度学习基础、线性代数、Python
重要程度： ※※※※※

课程定位

CS231N 是全球影响力最大的深度学习课程之一，也是很多人进入计算机视觉和现代神经网络的第一门硬核课。虽然名字里写的是视觉识别，但它讲到的很多网络结构、训练范式和工程经验已经成为整个深度学习社区的通用语言。

核心内容

CNN 基础、卷积结构与视觉归纳偏置
检测、分割、识别等视觉任务
RNN、Transformer 和更一般的深度模型框架
训练技巧、优化、可视化与误差分析
深度学习研究中的实验设计与系统调试

为什么它不只是一门视觉课

很多人学完 CS231N 的最大收获并不是“会做图像分类”，而是第一次真正理解深度模型该如何组织实验、如何诊断问题、如何阅读现代 DL 论文。它是非常好的研究入门课。

学习难点

作业量大，工程实现要求高
默认你对深度学习基础已经比较熟
课程会很快进入现代模型和研究讨论，不适合零基础直接冲

学完后的衔接

视觉基础不足：先补 CS131、CS231A
生成与多模态：可继续看 CS236 与更近年的视觉 / 多模态专题

课程定位​

核心内容​

为什么它不只是一门视觉课​

学习难点​

学完后的衔接​

课程定位

核心内容

为什么它不只是一门视觉课

学习难点

学完后的衔接