从直观上来看,协方差表示的是两个变量总体误差的期望。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果
X
与
Y
是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足
E
[
XY
]=
E
[
X
]
E
[
Y
]。
但是,反过来并不成立。即如果
X
与
Y
的协方差为0,二者并不一定是统计独立的。
协方差
Cov
(
X
,
Y
)的度量单位是
X
的协方差乘以
Y
的协方差。
协方差为0的两个
随机变量
称为是不相关的。
由协方差定义,可以看出Cov(X,X)=D(X),Cov(Y,Y)=D(Y)。
协方差作为描述X和Y相关程度的量,在同一物理量纲之下有一定的作用,但同样的两个量采用不同的量纲使它们的协方差在数值上表现出很大的差异。为此引入如下概念:
称为随机变量X和Y的(Pearson)相关系数。
若
ρ
XY
=0,则称X与Y不线性相关。
即
ρ
XY
=0的
充分必要条件
是Cov(X,Y)=0,亦即不相关和协方差为零是等价的。