跳到主要内容

哈佛 CS109 数据科学概论

课程名称: Data Science
课程官网地址:哈佛CS109课程官网CS109a 2021年CS109b 2021年
先修课程:
重要程度: ※※※※※
课程评点: CS109分CS109A和CS109B,同时也分对校内的版本以及面向社会免费开放的版本。

CS109A课程

课程说明

哈佛的 CS109A 课程是数据科学的入门课程,专为具有一定编程经验的学生设计。该课程涵盖数据科学的广泛主题,包括数据清理、可视化、分析和机器学习。学生学习使用 Python 等工具处理数据并构建统计模型。该课程还包括一个重要的小组项目组成部分,学生在其中团队合作,将他们的技能应用于现实世界的数据科学问题。总体而言,该课程旨在为学生提供坚实的数据科学基础,并为他们在该领域的进一步学习做好准备。

在整个学期中,我们的内容持续围绕五个关键方面:

  • 数据收集——数据整理、清理和采样以获得合适的数据集;
  • 数据管理——快速可靠地访问数据;
  • 探索性数据分析——产生假设并建立直觉;
  • 预测或统计学习
  • 沟通——通过可视化、故事和可解释的总结来总结结果。

CS109B课程

CS109B 是哈佛大学数据科学的一门更高级的课程,专注于深度学习和概率机器学习的主题。该课程涵盖构建和训练深度神经网络的技术,例如卷积神经网络 (CNN) 和递归神经网络 (RNN),以及该领域的最新发展,例如 BERT 和 GPT、GAN 等转换器和语言模型,甘斯风格。此外,该课程还探讨了聚类等无监督学习技术,并涵盖了贝叶斯框架中的概率机器学习。总体而言,该课程旨在让学生深入了解数据科学的先进技术,并为他们在该领域的研究或职业做好准备。