卫生学电子教材-第七章计量资料的统计方法:第三节计量资料的统计推断

来源：南华大学资源网精品课程网

卫生学电子教材第七章计量资料的统计方法:第三节计量资料的统计推断:◎<一、均数的抽样误差与标准误>◎<二、平均分布>◎<三、总体均数的区间分布>◎<四、假设检验>一、均数的抽样误差与标准误本节介绍计量资料的统计推断。正态分布总体有2个参数或特征量——均数μ和标准差σ，其中均数作为总体变量值的代表值，是最重要的。医学现象受特定因素的影响反映在均数的变化上。例如性别和年龄对儿童身高的影响反映在儿童身高的均数的变化上。因此计量资料的统计推断主要指如何由样本统计量推断总

◎<一、均数的抽样误差与标准误>	◎<二、平均分布>	◎<三、总体均数的区间分布>
◎<四、假设检验>

一、均数的抽样误差与标准误

本节介绍计量资料的统计推断。正态分布总体有2个参数或特征量——均数μ和标准差σ，其中均数作为总体变量值的代表值，是最重要的。医学现象受特定因素的影响反映在均数的变化上。例如性别和年龄对儿童身高的影响反映在儿童身高的均数的变化上。因此计量资料的统计推断主要指如何由样本统计量推断总体均数。

设X是均数为μ、标准差为σ的总体的变量，从总体中随机抽取含量n的样本，算出样本均数，所有可能的含量n的样本均数构成变量为的总体。由于原总体中的X值存在差别，随机抽样每个样本抽到的n个X值有所不同，因此样本均数总体中的值也存在差别。在第五章第一节已述，由抽样造成的样本统计量和相应总体参数的差别称为抽样误差，因此由抽样造成的样本均数和总体均数的差别称为均数的抽样误差。样本均数总体中值的差别是抽样误差造成的。总体均数μ为定值，分析样本均数的分布情况就可得出抽样误差 -μ的分布情况。下述规律是用数理统计理论推导出来的：

1.若原变量X服从正态分布，则含量n的样本均数也服从正态分布。即使原变量X服从偏态分布，据中心极限定理（central limit theorem)，当n足够大时（比如n＞30)，也近似服从正态分布。

2.若原变量 X的总体（不管正态或偏态)均数为 μ、标准差为σ，则

从无限总体抽样而言，从有限总体抽样此关系近似成立)为

统计学中把样本统计量的标准差又称为标准误（standard error)，因此样本均数的标准差又称为均数的标准误。均数的标准误是描述均数的抽样误差的统计指标（变异指标)，均数的标准误越大，则均数的抽样误差越大（更确切地说，是抽样误差的波动程度越大)。

由(7·15)式可见，个体X值的标准差σ越大，均数值的标准误

全相同的特殊情况，即σ=0，此时不管什么样本，样本中n个X值相同，所

别，n越大，这种均衡作用越大。从同一总体中抽样，总体标准差为定值，因此要减小均数的标准误，降低抽样误差，只有加大样本含量。

总体标准差σ一般是未知的，若用样本标准差s估计，则据（7·15)例7· 17 求例7·2中10名7岁男孩体重均数的标准误。

在例7·9中已算得s=2.6kg，故

该地10名7岁男孩体重均数的标准误为0.8kg。

返回顶部

二、平均分布

上节（7·14)式曾说明，若X服从正态分布N（μ，σ)，作正态变量X的u转换u=（X-μ)/σ，则标准正态变量u服从标准正态分布 N（0，1)。现从正态总体N（μ，σ)抽取含量n的样本均数服从正态分布N

如果知道总体标准差，上式的u可用作为推断总体均数的样本检验统计量。u检验就是基于此式。但一般的实际情况是总体标准差σ和总体均数μ都是未知的，此时不能用u来推断总体均数。数理统计学中证明，当总体标准差未知时，可作正态变量的t转换

t变量为样本www.lindalemus.com/shouyi/检验统计量，用以推断总体均数。

个t值，所有可能的含量n的样本t值构成t变量的总体或t分布。

t分布只有1个参数——自由度ν，为计算t的标准差的自由度。（7·18)式t的ν=n-1，因为其s的ν=n-1。t分布曲线如图7-3所示。横轴为t变量，纵轴为t的概率密度f（t)。t分布曲线的特点是：以0为中心，高峰位于0处，左右两侧对称；ν越小，t变量值的离散程度越大，曲线越扁平。t分布曲线较标准正态曲线要扁平些（高峰低些，两尾部翘得高些)，若ν=∝，则t分布曲线和标准正态曲线完全吻合。t分布曲线下的整个面积为1，t分布曲线下t从a到b（＞a)的面积为t值分布在此范围内的百分比，即t值落在此范围内的概率P。对于自由度为ν的t分布，如下定义t_α_，v值（取正值)，称为自由度为ν、P为α的t界值。

双侧： P（t≤-t_α_，v)和P（t≥t_α_，v)为α，由于t分布以0为中心对称，即

P（t≤-t_α_，v)=P（t≥t_α_，v)=α/2

于是有 P（-t_α_，v＜t＜t_α_，v)=1-α

单侧：P（t≤-t_α_，v)=α或P（t≥t_α_，v)=α

由上可知，单侧α和双侧 2α的t界值相同，即单侧t_α,v=双侧t_2α,v。如ν=20时，单侧t_0.05,20=双侧t_0,10,20。

根据t分布曲线下的面积计算，由ν值和α值可得出t_α,v值。表7-9是常用的t界值表，横标目为自由度ν，纵标目为概率P（即α)。由表7-9可见，对于相同的自由度ν，α值越小，t_α,v值越大；对于相同的α值，自由度ν越大，t_α,v值越小。当ν=∝时，则t_α,v=u_α，故查u界值即可查ν=∝的t界值。

要说明的是，若变量X服从偏态分布，但据中心极限定理，当样本含量足够大时，其样本均数近似服从正态分布，因此凡用u和t的推断正态分布总体均数的统计方法，只要样本含量足够大（比如n＞30)，也可近似用于推断偏态分布的总体均数。只是不对称的偏态分布总体不宜用均数来反映其平均水平。但如果偏态分布和正态分布相差不太远，用均数也不必太担心会不恰当。

返回顶部

三、总体均数的区间估计

由样本统计量推断总体均数有2个重要方面：区间估计（interval estimation)和假设检验（hypothesis testing)。先介绍总体均数的区间估计。

仅由样本均数估计总体均数称为点估计（point estimation)。点估计虽然简单，但缺点是未考虑抽样误差。总体均数的区间估计是由抽样误差规律，按一定概率（可信度)估计总体均数在哪个区间（范围)，称为总体均数的可信区间（confidence interval)。其可信度（confidence level)要预先确定。可信度用1-α表示，常用的可信度为95%，如要提高可信度则可用99%。

设正态总体为N（μ，σ)，从中随机抽取含量n的样本：X₁，X₂，…，X_n。要由样本估计总体均数μ的1-α可信区间。

自由度ν=n-1的t分布，因此有

故总体均数μ的1—α可信区间为

可信区间的 2个端点值称为可信限（confidence limit)， -t_α,vs 为可信区间的下限， +t_α,vs 为可信区间的上限。可信区间是指以上、下可信限为界的一个范围，样本均数作为总体均数的点估计处于可信区间中心。

例7·18 由例7·2中某地10名7岁男孩体重的样本资料，求该地7岁男孩体重均数的95%可信区间。

ν=n-1=10-1=9， 1-α=0.95，α=0.05，查t界值表得双侧t界值t_0.05,9=2.262，故有

21.4±2.262×0.8=19.6～23.2（kg)

该地7岁男孩体重均数的95%可信区间为19.6～23.2kg。

可信度所指的可信区间包括总体均数的概率是事先对计算可信区间的公

的概率为95%。事后抽出样本而得出具体的可信区间就不能那么说了，如例7·18不能说19.6～23.2kg包括总体均数的概率为95%，因为这时只有两种情况，一是推断正确，总体均数在该区间内；一是推断错误，总体均数在该区间外。而究竟是哪种情况，又不能确定。但是依据一个事件发生的概率可作为该事件实际发生的平均频率的道理，可得出结论：95%可信区间相当每100个由含量相同的样本算得的可信区间，平均有95个可信区间会包括总体均数，只有5个可信区间不会包括总体均数。5%是小概率，实际发生的可能性小，因此实际应用中就认为总体均数在算得的可信区间内，所冒犯错误的风险为5%。

可信区间估计总体均数的准确度即可信度。估计总体均数的精密度用可信区间的长度（上可信限—下可信限)来衡量比较，该长度越长，精密度越低。要提高估计总体均数的精密度可用加大样本含量来达到。因为n加大，

但在样本含量相同的情况下，若要提高估计总体均数的准确度，则必会降低精密度。因为1—α加大，则α减小，t_a_,_n加大，可信区间的长度变长。如99%可信区间比95%可信区间精密度要低。

返回顶部

四、总体均数的假设检验（t检验)

现介绍总体均数的假设检验（t检验)。

1.总体均数的假设检验（t检验)的基本思想总体均数的假设检验（t检验)有2个目的：①推断单个总体均数μ是否等于已知总体均数μ₀，设从均数为μ的总体抽取1个样本，样本均数为；②推断两个总体均数μ₁

μ=μ₀或μ₁=μ₂，这种情况差别相对小，称为差别无显著性；②除了由抽样误差造成外，还由总体均数的差别造成，即μ≠μ₀或μ₁≠μ₂，这种情况差别相对大，称为差别有显著性。因此假设检验也可称为显著性检验

断μ和μ₀或μ₁和μ₂是否相等是目的。其检验统计量为t，故亦称为t检验。检验的一般步骤如下（对照后例阅读)：

(1)作出总体均数（μ)或其差别（μ₁-μ₂)的假设，确定检验水准（α)：检验假设（也称无效假设)为H₁：μ=μ₀（或μ₁=μ₂)。检验假设的对立面备择假设为H₀，一般选用双侧μ≠μ₀（或μ₁≠μ₂)；如果某一侧μ＜μ₀（或μ₁＜μ₂)或μ＞μ₀（或μ₁＞μ₂)凭理论或经验判定实际不可能存在，或无实际价值、研究者不关心，则选用单侧μ＞μ₀（或μ₁＞μ₂)或μ＜μ₀（或μ₁＜μ₂)。给抽样误差概率按双侧或单侧确定某个水准，称为检验水准（size of a test)，亦称显著性水准（significance level)，定为小概率，一般定α=0.05，如要减小α则可定α=0.01。本书例题采用单侧检验予以说明，采用双侧检验则省去说明。

(2)根据检验假设（H₀)，计算检验统计量（t)值：选用什么检验统计量，决定于总体类型和要推断的总体参数。推断正态总体均数，当总体标准差未知时，用t检验（若总体标准差已知，则用u检验)。根据检验假设所定求t值的公式计算t值。

(3)根据检验统计量（t)值，以检验水准（α)判断是否拒绝检验假设

的高级职称考试网，可用所求得的t值以外（双侧或单侧)的t分布曲线以下的面积，即概率P值来衡量。表7-9的t界值表有双侧和单侧的P=0.05和P=0.01，求P值可得出P＞0.05、P≤0.05和P≤0.01。若t≥t_α,v（由于t界值是取正值，当求得的t值为负时，则取｜t｜)，即P≤α，则按α水准拒绝

（指双侧，或μ₁≠μ₂)。拒绝H₀所冒犯错误（无差别判断为有差别)的风险为小概率α。若t＜t_α,v，即P＞α，由于接受H₀所冒犯错误（有差别判断为无差别)的概率未知，故一般说成则按α水准不

（或μ₁≠μ₂)。

2.样本均数和总体均数比较的t检验从正态总体N（μ，σ)随机抽取含量n的样本，推断μ是否等于μ₀（一般为理论值或标准值，如正常人该指标的均数)。作和μ₀比较的t检验，用（7·18)式计算t值（式中μ为μ₀)，ν=n-1。

例7·19 已知健康成年男子的脉搏均数为72次/分。某医生在一山区抽样调查了25名健康成年男子，求得其脉搏均数为74.2次/分，标准差为6.0次/分。问该山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数？

已知一般成年男子脉搏数总体的均数μ₀为72次/分，设山区成年男子脉搏数总体的均数为μ，假设为：

H₀：μ=72次/分

H₁：μ＞72次/分

单侧α=0.05

式有

查t界值表得P＞0.05。按α=0.05水准不拒绝H₀，尚不能认为山区成年男子的脉搏均数高于一般成年男子的脉搏均数。

3.配对差值均数和总体均数0比较的t检验推断两个总体均数是否相等有配对设计和成组设计，先介绍配对设计。医学研究的配对有同源配对和异源配对。同源配对为自身对照，是同一个体的处理前和后（如病人治疗的前和后)、两种处理方法（如血液化验的甲法和乙法)等配对或对照；异源配对是将两个个体按一些影响研究结果指标的因素齐同配成对子，如将性别相同、年龄、生活、劳动条件相近的两个人配成对子，同对的两个个体每个个体给予一种处理。配对设计资料的t检验相对于成组设计资料的t检验，如果样本含量相同，可提高两个总体均数差别的假设检验的检验效能（power of atest)——若两个总体均数有差别通过假设检验而判别有差别的概率；如果使检验效能相同，则可减少样本含量。

从正态总体N（μ₁，σ₁)和N（μ₂，σ₂)配对抽取n对变量值，配对差值d=X_d-X_d服从正态分布N（μ_d，σ_d)，其中μ_d=μ₁-μ₂，配对例7·20 用克矽平治疗10名矽肺患者，治疗前后血红蛋白含量如表7-10。问矽肺患者经克矽平治疗后血红蛋白含量是否有改变？