协方差
在平均数、变异数的优缺点中已经介绍了度量集中性的平均数,如算术平均数、中位数、众数等和度量离散性的变异数如方差、标准差等概念和具体理解。随着学习的深入,我们很快就会接触到协方差这一概念。那么协方差又如何理解呢?
我们知道平均数是进行集中性度量,方差是离散型的度量,但要是考虑两个变量之间的相互关系时,它们都哑火了。这时就该轮到协方差上场了!对二维随机向量(X,Y)来说,期望E(X),E(Y)只反映了X,Y各自的平均值,方差D(X),D(Y)只反映了它们各自与它们均值的偏离程度,它们都对X,Y之间的相互关系不提供任何信息。于是定义:E((X-E(X)(Y-(Y)))为X与Y的协方差,记为Cov(X,Y).
即:
Cov(X,Y)=E(((X-E(X))(Y-E(Y)))
计算式:
Cov(X,Y)=E(XY)-E(X)E(Y)
如果协方差Cov(X,Y)存在,并且X,Y的方差均大于0,则将Cov(X,Y)/sqrt[D(x)*D(Y)]定义为相关系数。可不要小瞧了这个相关系数,它将在以后的课程中大放异彩!