深度学习篇---解空间与最小二乘法、主成分分析的关系
解空间零空间与最小二乘解、主成分分析PCA之间存在着深刻而优美的内在联系。它们分别从“完美映射”、“最佳投影”和“信息压缩”三个角度展现了线性代数结构的威力。 解空间与最小二乘解从“无解”到“最佳近似”当线性方程组 Axb 无解时即 b 不在 A 的列空间内我们需要退而求其次寻找一个“虽不完美但最好”的近似解这就是最小二乘解。1. 正交投影与解空间最小二乘解的几何本质是正交投影。我们希望找到 Ax^使其是 b在 A 的列空间上的投影此时误差向量 b−Ax^ 与列空间正交。而解空间A 的零空间的引入出现在 A 的列不满秩时当 A 的列不满秩其零空间解空间不只包含零向量。此时最小二乘解有无穷多个而其中范数最小的那个就是误差允许范围内“最经济”的解。2. 与子空间的正交关系这里体现的是线性代数的核心正交分解零空间是行空间的正交补。矩阵的奇异值分解SVD正是连接这些空间的桥梁通过抛弃零奇异值对应的零空间分量我们得到了唯一的极小范数最小二乘解。一句话总结解空间的作用是容纳所有“不影响输出”的输入分量而极小范数最小二乘解就是主动将这些无用分量归零后的最干净解。 解空间与PCA从“相关”到“独立”主成分分析PCA的目标是找到数据方差最大的方向它与解空间的关系更为深刻。1. 协方差矩阵的零空间PCA的核心是求解协方差矩阵的特征向量。当我们计算数据矩阵 X 的协方差矩阵 ΣXTX 时Σ 的零空间解空间是数据方差为0的方向。沿着这些方向所有样本的投影完全重合不包含任何区分信息是冗余维度。PCA正是通过特征值分解识别出这些零方差方向并将其丢弃从而自动实现降维。2. 数据矩阵的零空间从信息角度看数据矩阵 X 的零空间是那些被矩阵 X “压缩为零”的模式。而PCA保留的主成分空间X 的非零奇异值对应的右奇异向量恰好是 XX 的行空间。解空间与主成分空间正交共同构成完整的输入空间。一句话总结PCA的过程就是从数据中分离出有用方差主成分空间并丢弃零方差冗余零空间/解空间的过程。 三者共同点SVD作为统一桥梁奇异值分解SVD能完美揭示这三者的本质联系。对任意矩阵 A 进行SVDV 矩阵的前 r 列张成行空间也是PCA的主成分空间后 n−r 列张成零空间。U 矩阵的前 r 列张成列空间进行投影拟合的空间后 m−r 列张成左零空间。因此解空间、最小二乘解、PCA的联系可以这样概括概念SVD视角下的位置扮演的角色解空间零空间V 矩阵的后 n−r 列被“压缩掉”的无用信息/自由度最小二乘解在 U 的列空间做投影截断零空间分量排除解空间干扰后的最佳拟合PCA主成分空间V 矩阵的前 r 列行空间保留信息、方差最大的主要方向 Mermaid总结框图 进一步思考从解空间到最小二乘解再到PCA本质上讲述的是同一个故事解空间定义了“无关紧要的方向”最小二乘解主动忽略这些方向寻求最干净的拟合PCA则主动识别并保留“至关重要的方向”丢弃解空间所对应的冗余。这正是线性结构对称性的深刻魅力所在。