南方医科大学教案首页
授课题目 | 计数资料的统计推断 | 授课形式 | 理论课 |
授课时间 | 授课学时 | 3 | |
教学目的 与 要 求 | 1. 熟悉卡方检验的基本思想,卡方检验的基本公式 2. 掌握两个率比较、多个率比较、构成比比较及配对资料的卡方检验方法 3. 了解行×列表的卡方分割,四格表的确切概率法 4. 了解频数分布拟合优度的卡方检验 | ||
基本内容 | 1. 四个表资料的卡方检验 1)卡方检验的基本思想及计算步骤 2)四格表卡方检验的条件,卡方检验的校正 2. 配对四格表资料的卡方检验 3. 行×列表的卡方检验 1) 多个率比较 2) 多个构成比比较 3) 双向有序资料的关联性检验 4. 行×列表的卡方分割法 5. 频数分布拟和优度的卡方检验 6. 四格表的确切概率法 | ||
重 点 难 点 | 1. 简述卡方检验的基本思想? 2. 四格表卡方检验有那两种类型?各自在运用上有何注意事项? 3. 四格表卡方检验各公式的适用条件? 4. 理论频数太小的三种处理方法? | ||
主要教学 媒 体 | 幻灯 | ||
主 要 外 语 词 汇 | Chi-square distribution goodness of fit test | ||
有关本内容的新进展 | 卡方检验的两两比较方法的选择 | ||
主要参考资料或相关网站 | 1. 徐勇勇主编. 医学统计学(第二版). 北京:高等教育出版社,2004 2. 杨树勤主编. 卫生统计学(第二版). 北京:人民卫生出版社,1991 3. 方积乾主编. 医学统计学与电脑实验(第二版). 招生简章上海:上海科学技术出版社,2001 4. 孙振球主编. 医学统计学(供研究生用). 北京:人民卫生出版社,2004 | ||
系、教研室 审查意见 | |||
课后体会 |
教学过程
教学内容 | 时间分配和 媒体选择 | ||||||||||||||||||||||||||||||||||||||||||||||
一. 率的抽样误差与可信区间 由于抽样而引起的样本率与总体率的差异称为率的抽样误差。与均数的抽样误差可以用均数的标准误度量一样,率的抽样误差的大小亦可以用率的标准误来度量。 例5-1 观察某医院产妇106人,其中行剖腹产者62人,剖腹产率为58.5%,试估计剖腹产率的标准误。 解:已知n=106,p=0.585,由公式5-2求得标准误为 二. 总体率的可信区间 与总体均数的估计相似,样本率是总体率的点估计值。同样,由于点估计的波动较大,因此,我们还需要知道总体率大概会在一个什么样的区间范围,即所谓的总体率的可信区间估计。 (一) 二项分布法 例5-2 某妇幼保健院对当地19对38例育龄夫妇的筛查中,检出α-地中海贫血基因携带者3例,试估计当地α-地中海贫血基因总体携带率的95%可信区间。 解:从附表8查得,在n=38横行与发生数X=3纵列交叉处的数值为2-21,即α-地中海贫血基因总体携带率的95%可信区间为2%-21%,或曰有95%的可能当地α-地中海贫血基因总体携带率是在2%-21%之间。 需注意,附表8只列出了发生数X≤n/2(发生率≤50%)的部分。当X>n/2时,应按n-X值查表,并相应地用100减去查得的数值,即为所求可信区间。 (二) 正态分布法 双侧: (p-uα/2·Sp, p+uα/2·Sp) 单侧: p-uα·Sp 或 p+uα·Sp 例5-4 据例5.1数据,试估计总体剖腹产率的双侧95%可信区间。 解:依题意可查得u0.05/2=1.96,将例5.1中求得的p=0.585,Sp =0.048代入,得 (0.585-1.96×0.048,0.585+1.96×0.048)=(0.491,0.679) 即该医院产妇总体剖腹产率的95%可信区间为49.1%-67.9%。 值得注意的是,在计算可信区间时,有可能遇到可信区间的下限小于0%(即负值),或可信区间的上限大于100%的情形。此时,应相应地将可信区间的下限表达为0%,可信区间的上限为100%。 三. 两个率的比较 χ2检验(chi-square test)是现代统计学的创始人Karl Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验,等等。本章仅限于介绍两个和多个率或构成比比较的χ2检验。 (一) 两个独立样本率比较的χ2检验 1. 两个独立样本率资料的四格表形式 表5-1 两种疗法的心血管病病死率比较
2. χ2检验的基本思想 χ2检验的基本思想可以通过χ2检验的理论公式(公式5-6和5-13)来理解。
式中,A为实际频数(actual frequency),T为理论频数(theoretical frequency)。根据检验假设H0:π1=π2,即两样本来自同一总体,或曰两总体率相同,则从理论上讲,各处理组的发生率和总发生率应相等 现回到理论公式5-6,若H0成立,则四个格子的实际频数A与理论频数T相差不应该很大,即χ2统计量不应该很大。若χ2值很大,即相对应的P值很小,比如P≤α,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑的H0正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。 3. 假设检验 ⑴ 建立检验假设,确定显著性水平。 H0:π1=π2,即两种疗法的心血管病总体病死率相同; H1:π1≠π2; α=0.05。 ⑵ 求检验统计量χ2值。 ① 非连续性校正χ2值 又称Pearsonχ2统计量,公式5-6为理论计算公式。 ② 连续性校正χ2值 又称Yates校正χ2统计量(Yates' correction for continuity with the chi-square statistic),是Pearsonχ2统计量的一个校正量。Yates(1934)认为,χ2分布是一连续型分布,而四格表资料属离散型分布,由此得到的χ2统计量的抽样分布也是离散性质的。为改善χ2统计量分布的连续性,他提出将实际频数与理论频数之差的绝对值减去0.5,于是理论公式5-6演变为公式5-15,故称这种校正为连续性校正。 因连续性校正公式中的分子部分较非连续性校正公式减去了一个常量,故所得χ2值必然较后者小,即必然有χ2>χ2c。这一差别有时会导致相互矛盾的统计推断结果。 ⑶ 求P值,下结论。 由于四格表资料为双边固定形式,即假设行合计与列合计均固定,所以四格表的自由度ν=1。由χ2界值表(附表10)查得χ20.05,1 =3.84,小于本例所得χ2值(无论是校正的或非校正的),所以P<0.05,按α=0.05水准拒绝H0,接受H1,用盐酸苯乙双胍治疗引致的心血管病病死率高于安慰剂 (二) 两个相关样本率比较的χ2检验(McNemar检验) 1.资料类型:两个相关样本率资料又称配对计数资料,顾名思义,是采用配对设计,且结果以计数方式表达的资料。 例5-9 某抗癌新药的毒理研究中,将78只大鼠按性别、窝别、体重、年龄等因素配成39对,每对大鼠经随机分配分别接受甲剂量和乙剂量注射,实验结果见表5-4。试分析该新药两种不同剂量的毒性有无差异。 表5-4 某抗癌新药两种剂量的毒理实验结果
2. 假设检验 对于表5-5资料,如果不考虑两种处理结果相同的情形,即忽略甲+乙+的对子数a和甲-乙-的对子数d,而只考察甲+乙- 的对子数b与甲-乙+的对子数c之间有无差异,就产生了两个相关样本率比较的χ2检验,又称McNemar检验(McNemar's test for correlated proportions)。 本例检验过程如下: H0:两总体b=c H1:两总体b≠c α=0.05 已知b=12,c=3,因b+c=15,故将其代入公式5-18,有
查χ2界值表(附表10),得0.025<P<0.05,按α=0.05水准拒绝H0,接受H1,可以认为两种剂量的毒性有显著性差异,甲剂量组的死亡率较高(因b>c)。 (三)两组构成比的比较 例5-12 为研究两种口服洁肠剂的不良反应,将192例接受洁肠处理的患者随机分为两组,一组94例口服硫酸镁;另一组98例口服甘露醇。服后的反应见表5-6,试比较之。 解: ① 建立检验假设,确定显著性水准。 H0:两处理组的总体构成相同; H1:两处理组的总体构成不同; α=0.05。 ② 求检验统计量和自由度。将表5-6数据代入公式5-22,有 χ2=80.69,df=4 求P值,下结论。查χ2界值表(附表10)ν=4一行,因χ2=80.69>χ20.005,4=14.86,所以,P<0.005,以α=0.05水准拒绝H0,接受H1,即两种洁肠剂的服后反应构成不同,以甘露醇的不良反应率较高。 |