关于Python主成分算法分析算法PCA的问题?

        PCA的主要思想是移动坐标轴找到方差最大的方向上的特征值。什么叫方差最大的方向的特征值呢就像下图中的曲线B。一样它的覆盖范围最广。

基本步骤:(1)首先计算数据集的协方差矩阵

定义是变量向量减去均值向量然后乘以变量向量减去均值向量的再求均值。
比如x是变量μ是均值,等于E[(x-μ)(x-μ)^t],昰这种比如x=(x1,x2,...,xi)那么的第m行n列的数为xm与xn的,若m=n则是xn的。假设x的元素之间是独立的那么仅仅有对角线是有值,由于x独立的话对于m≠n的凊况xm与xn的为0另外矩阵是对称的。

伪代码例如以下(摘自机器学习实战):

PCA输入參数:參数一是输入的数据集參数二是提取的维度。比方參数二设为1那么就是返回了降到一维的矩阵。

PCA返回參数:參数一指的是返回的低维矩阵相应于输入參数二。

參数二相应的是移动坐標轴后的矩阵

上一张图。绿色为原始数据红色是提取的2维特征。

我要回帖

更多关于 主成分算法 的文章

 

随机推荐