医学全在线
搜索更多精品课程:
热 门:外科内科学妇产科儿科眼科耳鼻咽喉皮肤性病学骨科学全科医学医学免疫学生理学病理学诊断学急诊医学传染病学医学影像药 学:药理学药物化学药物分析药物毒理学生物技术制药生药学中药学药用植物学方剂学卫生毒理学检 验:理化检验 临床检验基础护 理:外科护理妇产科护理儿科护理 社区护理五官护理护理学内科护理护理管理学中 医:中医基础理论中医学针灸学刺法灸法学口 腔:口腔内科口腔外科口腔正畸口腔修复口腔组织病理生物化学:生物化学细胞生物学病原生物学医学生物学分析化学医用化学其 它:人体解剖学卫生统计学人体寄生虫学仪器分析健康评估流行病学临床麻醉学社会心理学康复医学法医学核医学危重病学中国医史学
您现在的位置: 医学全在线 > 精品课程 > 卫生统计学 > 河北医科大学 > 正文:卫生统计学电子教材:第十三章
    

卫生统计学-电子教材:第十三章

卫生统计学:电子教材 第十三章:前面学习的直线回归是研究一个应变量和一个字变量之间的线性依从关系的一种统计方法,但实际工作中,常会出现一个应变量受到多个自变量的影响,如:人的肺活量与身高、体重、胸围等因素有关;糖尿病病人的血糖变化会受到胰岛素、糖化血红蛋白、血清总胆固醇、甘油三酯等多种生化指标的影响。对这样的情况,仅用简单的直线回归分析是不够的,所以需要使用多元统计分析方法。第十三章 多重线性回归与相关第一节 多重线性回归的概念

前面学习的直线回归是研究一个应变量和一个字变量之间的线性依从关系的一种统计方法,但实际工作中,常会出现一个应变量受到多个自变量的影响,如:人的肺活量与身高、体重、胸围等因素有关;糖尿病病人的血糖变化会受到胰岛素、糖化血红蛋白、血清总胆固醇、甘油三酯等多种生化指标的影响。对这样的情况,仅用简单的直线回归分析是不够的,所以需要使用多元统计分析方法。

第十三章  多重线性回归与相关

第一节  多重线性回归的概念及其统计描述

一、概念

1.定义

研究一个因变量Y与多个自变量X1X2、…、Xm之间的线性依从关系的一种统计方法。

2.表达形式

研究的这种依从关系主要是通过方程来反映,如果能写出一个方程,则表示它们之间有线性依从关系,方程中有哪几个自变量,Y就与哪几个X有关。

多元线性回归方程的一般形式为:

其中Y——因变量

X1X1~Xm)——自变量,j=1,2, …,m

m——自变量的个数

β0——常数项,又称截距

βj——Xj的偏回归系数

ε——去除m个自变量对Y的影响后的随机误差,即残差

上面的多元线性回归方程是由总体数据而得出的,但在实际工作中往往得到的是样本数据,此时,求得的方程表达式为:

其中——因变量

Xj(X1~Xm)——自变量,j=1,2, …,m

m——自变量的个数

b0——常数项,是β0的估计值

bj——Xj的偏回归系数,是βj的估计值

3.偏回归系数的统计意义

通过一个简单的多元线性回归方程来讲解

为研究b1的意义,将X2固定在一个常数上,为计算方便取一个特殊的值,令X­2=0

X­1=0时,Y=1

  X­1=1时,Y=3

  X­1=2时,Y=5

可以看出,X1每增加一个单位,对应的Y平均增加b1个单位,所以bj的统计意义为:当固定X1X2、…、X-j-1X-j+1、…、XmXj每改变一个单位,因变量Y平均改变的单位数。

4.多元线性回归模型的应用条件

应满足下列3个条件:①YX1X2、…、Xm之间存在线性关系;②各观察值Yi相互独立;③残差ε服从均数为0,标准差为σ2的正态分布(对任意一组自变量X1X2、…、Xm和因变量Y具有相同方差,并且服从正态分布)

5.多元线性回归分析的一般步骤

1)根据样本数据建立模型,即求b0b1b2、…、bm

2)对回归方程及各偏回归系数进行假设检验

二、多元线性回归方程的建立

学习多元线性回归分析的关键就是要找到对应的方程,即求b0b1b2、…、bm。求偏回归系数bj和常数项b0也是根据最小二乘原则。

1.建立方程的方法

1)根据最小二乘原则,可以首先建立一个正规方程组,

正规方程组为:

该方程组有以下几个特点:

①方程组中有m个方程,每个方程中有m个未知数,每个未知数的系数为lij(离均差积和或离均差平方和)

 当i=j时,为离均差平方和,

 当ij时,为离均差积和,

另外,在方程的右侧ljy也是离均差积和,

②方程组中的离均差平方和及离均差积和构成了一离差矩阵,表示为

2)求解这个方程组即可得到b0b1b2、…、bm

3)根据公式求b0

2.例题

 P242 例15-1

1)准备计算

①求各自变量和因变量的均数、观察值之和合观察值的平方和

②求离均差积和及离均差平方和

2)写出正规方程组

3)求解方程组,可以用代入法、消元法,也可以使用统计软件

4)求b0

5)写出多元线性回归方程

第二节  多重线性回归方程的假设检验

建立的方程是根据样本算出的,不可避免的会存在抽样误差,所以需进行假设检验。假设检验的内容有两方面

一、对回归方程假设检验及评价

1.假设检验——方差分析

H0:文字叙述:所建方程无统计意义(即因变量Y与一组自变量Xj间无线性依从关系)

符号表示:β1=β2=…=βm=0(所有偏回归系数均为0)

H1:文字叙述:所建方程有统计意义(即因变量Y与一组自变量Xj间有线性依从关系)

符号表示:βj不为零或不全为零

α=0.05

 

其中  ν=m

SS=SS-SS   ν=n-m-1

SS=lyy  ν=n-1

2.决定系数R2

多元线性回归方程的决定系数

决定系数R2的取值范围0≤R2≤1,说明自变量X1X2、…、Xm能够解释Y变化的百分比,R2越接近1,说明回归模型对数据的拟合程度越好。

3)复相关系数R

用来衡量因变量Y与多个自变量间的线性相关程度,即观察值Y与之间的相关程度。

二、各偏回归系数的假设检验与评价

H0成立,所建回归方程无统计意义,则多元线性回归分析结束;但若如本例H0不成立,说明Y与一组X间有线性依从关系,但不能说明Y与每个X均有关系,故应进一步对每个偏回归系数进行检验。

1.F检验

计算统计量:Xj的偏F值 

SS(Xj)——Xj的偏回归平方和,表示模型中含有其他m-1个自变量的条件下,该自变量对Y的回归贡献www.lindalemus.com/jianyan/,相当于从回归方程中剔除Xj后所引起的回归平方和减少医学全.在线量,或在m-1个自变量的基础上新增加Xj后所引起的回归平方和增加。偏回归平方和越大,说明相应的自变量Xj越重要,对方程的贡献越大。

SS(Xj)的计算方法:原始数据中将Xj去除后,重新建立另一个方程,求出新建的方程的SS,表示为SS回(-j),此时用含m个自变量的回归方程的SS减去含m-1个字变量的回归方程的SS即为SS(Xj),即:SS(Xj)=SS- SS回(-j)

2.t检验法

,Sbj为bj的标准误,其计算方法复杂需使用矩阵获得。偏F检验等价,

tj服从自由度为n-m-1的t分布,查界值表,确定P,从而得出结论。

对于统一资料,t值和偏回归平方和一样,能说明自变量对方程的贡献大小,t越大说明该自变量对方程的作用越大。

3.标准化偏回归系数

前面讲到了使用偏回归平方和、tj可以衡量各自变量对Y贡献大小,但我们更希望通过方程中回归系数的大小来描述。偏回归系数的统计意义为:固定X1X2、…、X-j-1X-j+1、…、XmXj每改变一个单位,因变量Y平均改变的单位数。虽然bj决定了Y平均改变的单位数,但由于各自变量的单位不同,但从各个偏回归系数的绝对值大小不能判断该自变量对Y的贡献大小。所以我们对数据进行标准化,,利用标准化后的数据建立回归方程,称为标准化回归方程,,相应的各偏回归系数称为标准化偏回归系数。标准化后回归方程的截距为0,且

用标准化偏回归系数可以比较各自变量XjY的贡献大小,通常在偏回归系数有统计意义的前提下,标准化偏回归系数的绝对值越大,说明相应自变量对Y的作用越大。

...
关于我们 - 联系我们 -版权申明 -诚聘英才 - 网站地图 - 医学论坛 - 医学博客 - 网络课程 - 帮助
医学全在线 版权所有© CopyRight 2006-2046,
皖ICP备06007007号
百度大联盟认证绿色会员可信网站 中网验证
Baidu
map