高维向低维投影
PCA降维中就是把高维的数据点投影到低维,以2维举例,两个columns,x1、x2,投影到1个维度上
把点投影(projection)到某个方向,该方向做一条过原点的直线,点到直线作一条垂线,垂线与直线的交点到原点的距离就是把点投影到某个方向的value。
图中,红色点是原始数据点,蓝色点是中心化后的数据点,从图上可以看到,中心化并不影响投影后的方差,每一对(原始点投影value,中心化点投影value)之差都是恒定的。投影的数学表示:
上图就是2维的每个点怎么被降维到1维的,右边(1/sqrt(2),-1/sqrt(2))需要是单位向量,左边每一行是一个点,也可以视为1个向量,和单位向量内积就是投影过后的value。向量内积a·b = |a||b|cosθ,b是单位向量,|b| = 1,|a|cosθ就在b方向的投影,几何意义很明确,这个几何意义在二维、三维空间中有效。
留言
張貼留言