DRAFT
仅供学习使用,不得用于商业目的。 https://github.com/exacity/deeplearningbook-chinese
深度学习
2017年7月27日
DRAFT
仅供学习使用,不得用于商业目的。 https://github.com/exacity/deeplearningbook-chinese
目录
致谢 xvi
网站 xxii
数学符号 xxiii
第一章 引言 1
1.1本书面向的读者 . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2深度学习的历史趋势 . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1神经网络的众多名称和命运变迁 . . . . . . . . . . . 12
1.2.2与日俱增的数据量 . . . . . . . . . . . . . . . . . . . 17
1.2.3与日俱增的模型规模 . . . . . . . . . . . . . . . . . . 19
1.2.4与日俱增的精度、复杂度和对现实世界的冲击 . . . . 22
第一部分 应用数学与机器学习基础 25
第二章 线性代数 27
2.1标量、向量、矩阵和张量 . . . . . . . . . . . . . . . . . . . . 27
2.2矩阵和向量相乘 . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3单位矩阵和逆矩阵 . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4线性相关和生成子空间 . . . . . . . . . . . . . . . . . . . . . . 32
2.5范数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.6特殊类型的矩阵和向量 . . . . . . . . . . . . . . . . . . . . . . 36
2.7特征分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
iii
DRAFT
仅供学习使用,不得用于商业目的。 https://github.com/exacity/deeplearningbook-chinese
iv 目录
2.8奇异值分解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.9 Moore-Penrose伪逆. . . . . . . . . . . . . . . . . . . . . . . 40
2.10迹运算. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.11行列式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.12实例:主成分分析 . . . . . . . . . . . . . . . . . . . . . . . . 42
第三章 概率与信息论 47
3.1为什么要使用概率? . . . . . . . . . . . . . . . . . . . . . . . 47
3.2随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3概率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3.1离散型变量和概率质量函数 . . . . . . . . . . . . . . 50
3.3.2连续型变量和概率密度函数
深度学习_亚伦•库维尔.pdf