二、回归分析(regression analysis)
医学上,不少娈量间虽存在一定关系,但这种关系不象函数关系那样十分确定。例如正常人的血压随年龄而增高,但这只是总的趋势,有些高龄人的血压却不一定偏高;一群正常人按年龄和血压两个变量在坐标上的方位点,并非集中在一条上升直线上,而是围绕着一条有代表性的直线上升。
直线回归分析的任务在于找出两个变量有依存关系的直线方程,以确定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小。这个方程称为直线回归方程,据此方程描绘的直线就是回归直线。
(一)直线回归方程式(linear regression equation)的计算
直线回归方程的通式为:
=a+bX 公式(22.3)
式中Y为自由变量X推算因变量Y的估计值,a为回归直线在Y轴上的截距,即X=0时的Y值;b为样本回归系数(regression coefficient),即回归直线的斜率(slope或称坡度),表示当X变动一个单位时,Y平均变动b个单位。如果已知a与b,用以代入公式(22.3),即可求得直线回归方程。求a和b的公式分别为:
公式(22.4)
公式(22.5)
对样本中两个变量分析,不但可作相关分析,还可进一步作直线回归分析。仍以表22-1为示范,该例经过直线相关分析,r=0.6097,两变量间有直线关系,从相关系数计算时,已求得:
Σ(X-x)(Y-Y)=41.2000
Σ(X-x)2=677.4194
而 Y=ΣY/n=99.2/31=3.2000
x=ΣY/n=534/31=17.2258
代入公式(22.4)
b=41.2000/677.4194=0.0608
代入公式(22.5)
a=3.2000-0.0608×17.2258=2.1527
代入公式(22.3)
=2.1527+0.0608X
(二)样本回归系数的假设检验
样本回归系数也有抽样误差问题,故需对b作假设检验,以评估b是否可能从回归系数为零(即β=0)的总体中随机抽得的。
检验步骤:
H0:β=0 即b是由β=0的总体中随机抽样的样本回归系数。
H1:β≠0
α=0.05
t检验:检验公式为
tb=|b|/sb 公式(22.6)
式中sb是回归系数的标准误,计算公式为
公式(22.7)
式中sy.x为各观察值Y距回归直线(Y)的标准差,是当X的影响被扣除后Y方面的变异指标。可用以下公式计算:
公式(22.8)
公式(22.9)
本例上述已算得
Σ(X-x)2=677.4194
Σ(Y-Y)2=6.7400
Σ(X-x)(Y-Y)=41.2000
分别代入公式(22.9),(22.8),(22.7)和(22.6)得
Σ(Y-Y)2=6.7400-41.20002/677.4194=4.2343
tb=0.0608/0.01468=4.1417
分析评价 本例自由度v=31-2=29,查t值表,t0.01(29)=2.756,P<0.01,按α=0.05检验水准,拒绝无效假设,可以认为待产妇24小时尿中雌三醇含量与初生儿体重之间存在直线回归关系。医学全在线www.med126.com
(三)描绘回归直线
根据以上求得回归方程Y=2.1527+0.0608x,可以在自变量X的实测范围内(本例为7~27)任取X1和X2两值代入上式求得在图22-2中的P1(X1,Y1)和P2(X2,Y2)两坐标点,将两点连结为一直线,就属该方程的回归直线。作图要注意的是P1、P2两点最好距离远些,绘出的直线在坐标上误差就小些。
三、应用直线相关与回归分析时的注意事项
1.作相关与回归分析要有实际意义,不要把毫无关联的两个事物或两种现象作相关、回归分析。
2.两事物或现象间有相关,不一定有回果关系,也可能仅是伴随关系。但是,如果两事物或现象间存在因果关系,则两者必然是相关的。
3.相关与回归分析所说明的问题是不同的,但又是有联系的。相关表示相互关系,回归表示从属关系。可以证明,同一批资料所算得的r与b的检验统计量(tr,tb)是相同的,如本章的案例前后算得的tr=tb=4.14。由于相关系数的计算及假设检验比较方便,故可用相关系数的显著性检验取代回归系数的显著性检验。事实上在作回归分析之前,一般先作相关分析,而只有在确定了两变量间有直线关系的前提下,求回归方程及回归线才有意义。
4.相关与回归的应用,仅限于原实测数据的范围内,而不能随意外推。因为不知道在此范围之外,两变量间是否仍存在同样的直线关系。如果确有进行外推的充分根据和需要,亦应十分慎重。
5.在X与Y均呈正态变量时的加归分析中,由X 推算Y与由Y推算X的回归系数及回归方程是不同的,切勿混淆。
附表22-1 相关系数显著性界值表
v | R0.05(v´) | R0.01(v´) | V´ | R0.05(v´) | R0.01(v´) |
1 | 0.997 | 1.000 | 24 | 0.388 | 0.496 |
2 | 0.950 | 0.990 | 25 | 0.381 | 0.487 |
3 | 0.872 | 0.959 | 26 | 0.375 | 0.478 |
4 | 0.811 | 0.917 | 27 | 0.367 | 0.470 |
5 | 0.754 | 0.874 | 28 | 0.361 | 0.463 |
6 | 0.707 | 0.834 | 29 | 0.355 | 0.456 |
7 | 0.666 | 0.798 | 30 | 0.349 | 0.449 |
8 | 0.632 | 0.765 | 35 | 0.325 | 0.418 |
9 | 0.602 | 0.735 | 40 | 0.304 | 0.393 |
10 | 0.576 | 0.708 | 45 | 0.288 | 0.372 |
11 | 0.553 | 0.684 | 50 | 0.273 | 0.354 |
12 | 0.532 | 0.661 | 60 | 0.250 | 0.325 |
13 | 0.514 | 0.641 | 70 | 0.232 | 0.302 |
14 | 0.497 | 0.623 | 80 | 0.217 | 0.283 |
15 | 0.482 | 0.606 | 90 | 0.205 | 0.267 |
16 | 0.468 | 0.590 | 100 | 0.195 | 0.254 |
17 | 0.456 | 0.575 | 125 | 0.174 | 0.228 |
18 | 0.444 | 0.561 | 150 | 0.159 | 0.208 |
19 | 0.433 | 0.549 | 200 | 0.138 | 0.181 |
20 | 0.423 | 0.537 | 300 | 0.113 | 0.148 |
21 | 0.413 | 0.526 | 400 | 9.098 | 0.128 |
22 | 0.404 | 0.515 | 500 | 0.088 | 0.115 |
23 | 0.396 | 0.505 | 1000 | 0.062 | 0.081 |