课程描述
该课程为深度学习提供了实用的入门知识,包括理论动机以及如何在实践中进行实践。作为课程的一部分,我们将介绍多层感知器,反向传播,自动微分和随机梯度下降。此外,我们介绍了用于图像处理的卷积网络,从简单的LeNet到更新的体系结构(例如ResNet),以提供高度精确的模型。其次,我们讨论了序列模型和递归网络,例如LSTM,GRU和注意机制。在整个课程中,我们强调高效的实现,优化和可伸缩性,例如,针对多个GPU和多个计算机。本课程的目的是提供良好的理解和建立现代非参数估计量的良好能力。整个课程均基于Jupyter笔记本,以使学生快速获得经验。
课程大纲
课程主页
http://courses.d2l.ai/berkeley-stat-157/index.html#
课程视频截图