这篇博客主要介绍协方差与协方差矩阵的定义及其计算
首先给出常用的一些数理统计的计算公式:
均值:
标准差:
方差:
这几个公式大家肯定都是比较熟悉的,这里需要注意的地方是标准差以及方差计算时:
分母是n-1,这是因为这样能使我们以较小的样本集更好的逼近总体的标准差,即统计上所谓的“无偏估计”
。
均值描述的是样本集合的中间点,标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均,也就是样本的散布度。
标准差和方差一般是用来描述一维数据的,但现实生活我们常常遇到含有多维数据的数据集,面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解更多的内在联系,协方差就是这样一种用来度量两个随机变量关系的统计量,其结果表示两个随机变量 X 与 Y 之间相互关系,其定义如下:
从协方差的定义上我们也可以看出一些显而易见的性质,如:
那么协方差是如何表示两个随机变量 X 与 Y 之间相互关系的呢,通过下述三张图片来进行讲解:
当 X, Y 的联合分布像上图那样时,我们可以看出,大致上有: X 越大 Y 也越大, X 越小 Y 也越小,这种情况,我们称为“正相关”。
当X, Y 的联合分布像上图那样时,我们可以看出,大致上有:X 越大Y 反而越小,X 越小 Y 反而越大,这种情况,我们称为“负相关”。
当X, Y 的联合分布像上图那样时,我们可以看出:既不是X 越大Y 也越大,也不是 X 越大 Y 反而越小,这种情况我们称为“ 不相关”。
看上述3张图,在每张图的
区域(1)中有 X>EX ,Y-EY>0 ,所以(X-EX)(Y-EY)>0;
区域(2)中,有 X<EX ,Y-EY>0 ,所以(X-EX)(Y-EY)<0;
区域(3)中,有 X<EX ,Y-EY<0 ,所以(X-EX)(Y-EY)>0;
区域(4)中,有 X>EX ,Y-EY<0 ,所以(X-EX)(Y-EY)<0。
对于第一张图,当X 与Y 正相关时,它们的分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有E(X-EX)(Y-EY)>0 。
对于第二张图,当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和 (3)中,所以平均来说,有(X-EX)(Y-EY)<0 。
对于第三张图,当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有(X-EX)(Y-EY)=0 。
用协方差来表征这种关系:
当 cov(X, Y)>0时,表明 X与Y 正相关;
当 cov(X, Y)<0时,表明X与Y负相关;
当 cov(X, Y)=0时,表明X与Y不相关。
经过上述讲解,各位应该对协方差有所了解,而对于协方差矩阵而言,协方差矩阵的每个元素是各个向量元素之间的协方差,是从标量随机变量到高维度随机向量的自然推广。
在具体实现时,可以通过先对样本进行中心化(
1.
协方差矩阵
X,YX,YX,Y是两个随机变量,X,YX,YX,Y的
协方差
Cov(X,Y)Cov(X,Y)Cov(X,Y)
定义
为:
cov(X,Y)=E[(X−μx)(Y−μy)]
cov(X,Y) = E[(X-\mu_x)(Y-\mu_y)]
cov(X,Y)=E[(X−μx)(Y−μy)]
E(X)=μx,E(Y)=μy
E(X)=\mu_x,E(Y)=\mu_y
E(X)=...
均值E(x)=(95+ 85+ 75+ 65+ 55+ 45)/6=70 n=6(总体个数)
实际工作中,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本
方差
计算
公式:
S^2= ∑(X-Xi ) ^2 / (n-1) 所以n需要减1 ,Xi是x的均值。
协方差
: 用于反映两个维度之间的数据偏离期望值的相关性
当 Cov(X, Y)>0时,表明 X与Y 正相关;
例:如果观测NNN个人的体重www和身高hhh,这样会形成R2R^2R2的样本空间,观测向量XjX_jXj(Xj∈R2X_j\in R^2Xj∈R2)表示第jjj个人体重和身高,观测矩阵可以表示为:
[w1w1…wNh1h2…hN]\begin{bmatrix}w_1&w_1&\dots &w_N\\h_1&h_2&\dots &h_N \end{bmatrix}[w1h1w1h2……wNhN]
X1=[w1h1]X
方差
为
协方差
的一种特殊情况,即该变量与其自身之
协方差
。
若变量X的较大值主要与另一个变量Y的较大值相对应,而两者的较小值也相对应,则可称两变量倾向于表现出相似的行为,
协方差
为正。在相反的情况下,当一个变量的较大值主要对应于另一个变量的较小值时,则两变量倾向于表现出相反的行为,
协方差
为负。即
协方差
之正负号显示著变量的相关性。
协方差
的
定义
期望值分别为E(X)=μ\displaystyle E(X)=\muE(X)=μ 与 E(Y)=νE(Y)=\
方差
(variance):单个向量
方差
用来描述数值的分散(离散)程度,某个变量(向量)的
方差
可以用该变量的每个元素减去均值的完全平方再求平均来求得。
Var(a)=1m.∑i=1m(ai−μ)2
Var(a) = \frac 1m.\sum_{i=1}^{m} {(a_i-\mu)^2}
Var(a)=m1.i=1∑m(ai−μ)2
若将变量的均值化为零,则可以有
Var(a)=1m.∑i=1mai2
Var(a) = \frac 1m.\sum_{i=1}^{m} {a_i^2}
Var(a)=
计算
协方差矩阵
时,我们需要首先将数据进行中心化,即减去每个特征的均值,得到一个新的矩阵 X_centered。然后,
协方差矩阵
的
定义
是每个特征之间的
协方差
,因此我们需要
计算
X_centered 的转置矩阵 X_centered.T 和原矩阵 X_centered 的乘积,即 X_centered.T * X_centered,来得到
协方差矩阵
。
这是因为
协方差矩阵
的每个元素都是两个特征之间的
协方差
,而这个
协方差
可以通过两个特征的中心化数据的乘积来
计算
。具体来说,
协方差矩阵
的第 i 行第 j 列的元素是 X_centered 矩阵的第 i 列和第 j 列的乘积的均值。因此,在
计算
协方差矩阵
时,我们需要用到 X_centered.T 和 X_centered 的乘积,以便
计算
每个特征之间的
协方差
。