相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。
分别带入公式即可求解相关关系数。
相关系数性质1
若X和Y不相关,|pxy=0|,通常认为X和Y之间不存在线性关系,但并不能排除X和Y之间可能存在其他关系;若|pxy=0|,则X和Y不相关。
相关系数性质2
若X和Y独立,则必有|pxy=0| ,因而X和Y不相关;若X和Y不相关,则仅仅是不存在线性关系,可能存在其他关系,如x^2+y^2=1 ,X和Y不独立。
相关系数的三种计算公式
相关系数r的计算公式是ρXY=Cov(X,Y)/√[D(X)]√[D(Y)]。
公式描述:公式中Cov(X,Y)为X,Y的协方差,D(X)、D(Y)分别为X、Y的方差。
若Y=a+bX,则有:
令E(X) =μ,D(X) =σ。
则E(Y) = bμ+a,D(Y) = bσ。
E(XY) = E(aX + bX) = aμ+b(σ+μ)。
Cov(X,Y) = E(XY)−E(X)E(Y) = bσ。
变量间的这种相互关系,称为具有不确定性的相关关系。
⑴完全相关:两个变量之间的关系,一个变量的数量变化由另一个变量的数量变化所惟一确定,即函数关系。
⑵不完全相关:两个变量之间的关系介于不相关和完全相关之间。
⑶不相关:如果两个变量彼此的数量变化互相独立,没有关系。
广告
X 关闭
广告
X 关闭