第十一章 两医学招聘网变量关联性分析
在这章之前讲的所有统计分析方法,就算是计算公式在麻烦也只是研究一个指标,比如说方差分析,计算公式很多,但最终分析的就是各组的总体均数是否相同;秩和检验最终分析的就是总体分布是否相同。而本章研究的2个指标(变量)间的关系。
在中学时学习的两个变量间的关系是确定性的关系,比如:在黑板高度一定的情况下,黑板的面积与黑板的长度的关系是确定性的关系,一旦长度确定,面积就一定是这么多。
而我们现在研究的两个指标间的关系是非确定性的,比如:人的肺活量和体重之间的关系,不能一个人的体重是多少,那他的肺活量就是多少。虽然是非确定性的关系,但也是有关系,到底是什么关系,通过本章要学习的内容,可以找出一定的规律。
变量之间的关系,可以分成依从(因果)关系和相关关系。比如说,器皿中盛有NaCl溶液,在溶液未饱和之前,随着温度的上升,溶解度增加,此时,溶解度和温度之间的关系就是依从关系,我们在溶液中放一个气球,那么给容器加热,随着温度的升高,溶解度增加,气球的体积也会增大,此时溶解度和气球体积之间有关系,但这种关系就不是因果关系,而是相关关系。家庭中儿女身高和父亲身高之间的关系,子女的身高和父亲身高之间有关,这种关系是因果关系,但同一家庭中子女之间身高的关系就不是因果关系,而是相关关系。
第二节 秩相关
秩相关又称等级相关,是一种统计方法。研究两个变量间的线性相关关系的一种统计方法。前面学习的直线相关要求的条件非常严格,要求两个变量服从双变量正态分布,但在实际工作中,人体中的许多指标不满足该条件,所以不能用直线相关,此时可使用秩相关,它是一种非参数检验的方法。秩相关适用于以下几种情况:
1.不服从双变量正态分布而不宜作直线相关分析。
2.总体分布类型未知。(是否服从双变量正态分布不知道)
3.原始数据用等级表示,即等级资料。
等级相关的方法有很多种,书中介绍的为Spearman秩相关。
一、Spearman秩相关
1.表示符号及其意义
Spearman秩相关是用等级相关系数表示两个变量间的直线相关关系的密切程度与相关方向。样本等级相关系数——rs;总体等级相关系数——ρs
ρs =-1,两个变量完全负相关
-1<ρs<0,两个变量负相关
ρs =0,两个变量零相关
0<ρs<1,两个变量正相关
ρs =1,两个变量完全正相关
由于很少出现ρs =±1的时候,通常ρs的取值范围为:(-1,1),当越接近1,表示两变量的关系越密切;越接近0,表示两变量的关系越疏远。
2.秩相关系数的计算
基本思想:将几对观察值Xi、Yi,分别从小到大编秩,用Pi表示Xi的秩次,Qi表示Yi的秩次,每对的Pi和Qi可能相等也可能不等,考虑使用Pi和Qi之差来反映X、Y变量的秩次排列一致性的情况。令:di=Pi-Qi,由于di可以有正有负,不能完全反映其差值的大小,故取:。在n一定时,当每对Xi、Yi对应的秩次完全相等即Pi=Qi时,Xi、Yi完全正相关,此时;而当每对Xi、Yi对应的秩次完全相反时,Xi、Yi完全负相关,此时达最大值,所以:从0到其最大值的范围内的变化,反映了X、Y变量的相关程度。
为了和积差相关系数r表示相关程度和方向的形式一致,统计学及推导出了一个公式,即rs的计算公式:
3.秩相关系数的假设检验
计算出的是样本等级相关系数,所以需要对总体等级相关系数进行假设检验。假设检验的方法有两种:
1)当n≤50时,可以通过查表法进行检验。rs<界值,P>α;rs>界值,P<α
2)当n>50时,使用下面的公式计算统计量t,然后查t界值表确定P值。
4.例题
P151例9-8
1)编秩:分别对X、Y分别编秩,编秩的原则:①两个变量要分别从小到大编秩;②遇到观察值相同的一定要求平均秩次
2)计算每对观察的秩次之差:di=Pi-Qi
3)计算秩相关系数rs:
4)假设检验:
1.计算公式
当相同秩次较多时求出的rs和ρs的偏差较大,故而需要进行校正求rs’
其中,tj——X(或Y)中第j个相同秩次的个数
2.例题
P167 习题3
3.简便算法
此种方法无论有无相同的秩次均可使用,计算公式:
其本质就是使用秩次代替原变量值作积差相关计算。