医学全在线
搜索更多精品课程:
热 门:外科内科学妇产科儿科眼科耳鼻咽喉皮肤性病学骨科学全科医学医学免疫学生理学病理学诊断学急诊医学传染病学医学影像药 学:药理学药物化学药物分析药物毒理学生物技术制药生药学中药学药用植物学方剂学卫生毒理学检 验:理化检验 临床检验基础护 理:外科护理妇产科护理儿科护理 社区护理五官护理护理学内科护理护理管理学中 医:中医基础理论中医学针灸学刺法灸法学口 腔:口腔内科口腔外科口腔正畸口腔修复口腔组织病理生物化学:生物化学细胞生物学病原生物学医学生物学分析化学医用化学其 它:人体解剖学卫生统计学人体寄生虫学仪器分析健康评估流行病学临床麻醉学社会心理学康复医学法医学核医学危重病学中国医史学
您现在的位置: 医学全在线 > 精品课程 > 卫生学 > 南华大学 > 正文:卫生学电子教材:第二节  计数资料的统计推断
    

卫生学电子教材-第八章 计数资料的统计方法 :第二节 计数资料的统计推断

卫生学电子教材第八章 计数资料的统计方法 :第二节 计数资料的统计推断:◎<一、率的抽样误差与标准误>◎<二、总体率的区间估计>◎<四、总体率的假设检验>一、率的抽样误差与标准误本节和下节介绍计数资料的统计推断。本节介绍最简单的计数资料是分成两类,计数资料原分成多类但只研究其中特定的一类也可简化为两类——某类和非某类。两类构成总体为:总个体数为N,某类个体数为M,非某类个体数为N-M。只有一个总体参数,据其实际含义称为某类的总体率或总体构成比,用π表示,即π=M/N。
<一、率的抽样误差与标准误><二、总体率的区间估计><四、总体率的假设检验>
一、率的抽样误差与标准误

本节和下节介绍计数资料的统计推断。本节介绍最简单的计数资料是分成两类,计数资料原分成多类但只研究其中特定的一类也可简化为两类——某类和非某类。

两类构成总体为:总个体数为N,某类个体数为M,非某类个体数为N-M。只有一个总体参数,据其实际含义称为某类的总体率或总体构成比,用π表示,即π=M/N。

率(或构成比)的抽样误差与标准误和均数的抽样误差与标准误其概念相同。从总体率为π的两类构成总体中随机抽取含量n的样本,抽得某类个体数X(非某类个体数n-X),算出样本率p=X/n。由抽样造成的样本率和总体率的差别称为率的抽样误差。所有可能的含量n的样本率构成变量为p的总体。样本率总体中p值的差别是由抽样误差造成的。总体率π为定值,分析样本率p的分布情况就可得出抽样误差p-π的分布情况。数理统计学中证明,含量n的样本率p的总体均数为π,标准差为

率的标准差又称为率的标准误。率的标准误是描述率的抽样误差的统计指标(变异指标),率的标准误越大,则率的抽样误差越大(更确切地说,是抽样误差的波动程度越大)。

由(8·8)式可见,率的标准误σp的大小决定于总体率π和样本含量n,n越大,σp越小。从同一总体中抽样,总体率为定值,因此要减小率的标准误,降低抽样误差,只有加大样本含量。

总体率π一般是未知的,若用样本率p估计,则据(8·8)式,σp的样本估计值为例8·3 在某镇按人口的1/20随机抽取329人,作血清登革热血凝抑制抗体反应检验,发现阳性者29人,求阳性率及其标准误。

该镇329人血清登革热血凝抑制抗体反应检验的阳性率为8.81%,标准误为1.56%。

关于样本率p的总体分布,作说明如下:两类构成总体某类率为π,非某类率为1-π。从总体中抽取含量n的样本,抽得某类个体数X和某类率p是不连www.lindalemus.com续的,其取值可能情况为X=0,1,2,…,n,即p=0/n,1/n,2/n,…,n/n。由于抽得某类个体的概率为π,抽得非某类个体的概率为1-π,数理统计学中证明,p(或X)为上述各种取值的概率等于二项式〔(1-π)+π〕n。展开后的各项,故p(或X)服从二项分布。二项分布是不连续的概率分布,有2个参数:原总体率π和样本含量n。π=0.5,二项分布对称;π≠0.5,二项分布不对称。π和0.5相差越大,二项分布越不对称,特别当n小时更是如此。实际验证发现,当n足够大,π和1-π均不太小,有nπ≥5和n(1-π)≥5时,二项分布近似正态分布。因此当π<0.5时,总体率π越小,需要的样本含量n越大p分布才近似正态分布,例如π=0.2,0.1,0.05,则需要的样本含量至少为n=25,50,100。

  

返回顶部

二、总体率的区间估计

和由样本统计量推断总体均数一样,由样本统计量推断总体率(或总体构成比)有2个重要方面:区间估计和假设检验www.lindalemus.com/jianyan/。先介绍总体率的区间估计。

设两类构成总体某类总体率为π,从中抽取含量n的样本,抽得某类个体数为X,要由样本估计总体率π的1-α可信区间。

算出样本率p(X/n),当nπ≥5和n(1-π)≥5时,p近似服从均数为π、标准差(即标准误)为σp的正态分布,故标准正态变量为

当总体率π未知时,σp用其估计值sp取代,则近似有

当总体率π未知时,正态近似条件nπ≥5和n(1-π)≥5用np≥5和n(1-p)≥5取代,由于np=X,因此即样本中的某类个体数X≥5和非某类个体数n-X≥5。只要p不接近0或1,n较大即可达到此要求。在医学实际应用中,此条件一般容易满足,故总体率的区间估计常可用正态近似法。据(8·11)式,总体率的1-α可信区间为

ua值见上章的表7-8(也可见表7-9的ν=∝的ta值)。常用的是求总体率的95%可信区间,双侧u0.05=1.96,如要提高可信度,则求总体率的99%可信区间,双侧u0.01=2.58。样本率作为总体率的点估计处于可信区间中心。

例8·4求例8·3中某镇人群血清登革热血凝抑制抗体反应阳性率的95%可信区间。

在例8·3中已算得p=0.0881,sp=0.0156,故有:

0.0881±1.96×0.0156=0.0575~0.1187=5.75%~11.87%

该镇人群血清登革热血凝抑制抗体反应阳性率的95%可信区间为5.75%~11.87%。

注意的是:若样本中某类个体数X<5或非某类个体数n-X<5时,则不宜用正态近似法求总体率的可信区间,此时可据样本含量n和某类个体数X,查专门医学统计书中据二项分布算得的总体率的可信区间表。

返回顶部

三、总体率的假设检验(u检验)

 

推断单个总体率(或总体构成比)π是否等于已知总体率π0,和推断两个总体率π1和π2是否相等,其假设检验的基本思想和步骤和总体均数的假设检验相同。只是总体均数的假设检验其样本检验统计量为t,称为t检验;而总体率的假设检验其样本检验统计量为u,称为u检验。

1.样本率和总体率比较的u检验从未知总体率π的两类构成总体抽取含量n的样本,推断π是否等于π0(一般为理论率或标准率,如某病用常规药的治愈率)。作p和π0比较的u检验,据(8·10)式,计算u值的公式为

例8·5根据以往经验,一般胃溃疡病患者中有20%发生胃出血症状。现某医院观察65岁以上胃溃疡病人152例,有48例发生胃出血症状。问老年胃溃疡病患者是否较容易发生胃出血?

已知一般胃溃疡病患者总体的胃出血发生率π0为0.2,设65岁以上老年胃溃疡患者总体的胃出血发生率为π,假设为:

H0:π=0.2

H1:π>0.2

单侧α=0.05

今π0=0.2,n=152,X=48,

据(8·13)式有

单侧u0.01=2.326,现u>u0.01,得p<0.01。按α=0.01水准拒绝H0,接受H1,认为老年胃溃疡病患者较一般胃溃疡病患者较容易发生胃出血。

2.两个样本率比较的u检验从两个未知总体率π1和π2的两类构成总体分别抽取含量n1和n2的两个样本,数理统计学中证明,当π12=π时,两个样本率之差p1-p2的总体均数为0,标准差为

σp1-p2为两个率之差的标准误,其样本估计值为

式中pc为两个样本的合并率,是π的点估计。设p1=X1/n1,p2=X2/n2,则p2=(X2+X2)/(n1+n2)或pc=(n1p1+n2p2)/(n1+n2)。

当两个样本满足正态近似条件时,标准正态变量为

推断π1是否等于π2,作p1和p2比较的u检验,用(8·16)式计算u值。

例8·6在某山区小学随机抽取男生80人,其中肺吸虫感染23人;随机抽取女生85人,肺吸虫感染13人。问该山区小学男生和女生的肺吸虫感染率有无差别?

设该山区小学男生总体的肺吸虫感染率为π1,女生总体的肺吸虫感染率为π2,假设为:

H0:π12

H1:π1≠π2

α=0.05

今n1=80,X1=23;n1=85,X2=13。

据(8·16)式有

双侧u0.05=1.96,现u>u0.05,p<0.05,按α=0.05水准拒绝H0,接受H1,认为该山区小学男生和女生的肺吸虫感染率有差别,男生高于女生。

返回顶部


 


...
医学全在线 版权所有© CopyRight 2006-2046,
皖ICP备06007007号
百度大联盟认证绿色会员可信网站 中网验证
Baidu