教 案
2007 — 2008 学年 秋 季学期
所在单位 公共卫生与热带医学学院
系、教研室 生物统计学系
课程名称 卫生统计学
授课对象 2004级预防医学本科
授课教师阎玉霞
职 称 讲师
教材名称 卫生统计学
南方医科大学教案首页
授课题目 | 相关分析 | 授课形式 | 讲授 |
授课时间 | 2007-12-10 | 授课学时 | 3 |
教学目的 与 要 求 | 了解线性相关的概念 掌握线性相关系数的求解及其假设检验 了解相关系数的可信区间和相关系数的应用 | ||
基本内容 | 1. 线性相关的概念 2. 线性相关系数 3. 相关系数的假设检验 4. Spearman秩相关 5. 相关系数的可信区间 6. 相关系数应用的注意事项 7. 回归与相关的区别和联系 | ||
重 点 难 点 | 其中, 2、3、4为重点内容。 | ||
主要教学 媒 体 | 投影仪 | ||
主 要 外 语 词 汇 | Correlation coefficient | ||
有关本内容的新进展 | |||
主要参考资料或相关网站 | http://www.smmu.edu。cn/zykj/~statistics/index/index.htm 1. 徐勇勇主编. 医学统计学(第二版). 北京:高等教育出版社,2004 2. 杨树勤主编. 卫生统计学(第二版). 北京:人民卫生出版社,1991 3. 方积乾主编. 医学统计学与电脑实验(第二版). 上海:上海科学技术出版社,2001 4. 孙振球主编. 医学统计学(供研究生用). 北京:人民卫生出版社,2004 | ||
系、教研室 审查意见 | |||
课后体会 |
南方医科大学教案
教学内容 | 时间分配和 媒体选择 |
第十一章 两变量关联性分析 导入 第一节 线性相关 一、线性相关的概念及其统计描述 二、相关系数的统计描述 三、线性相关应用中应注意的问题 第二节 秩相关 一、秩相关的概念及其统计描述 二、秩相关相关系数的统计推断 第三节 分类变量的关联性分析 一、交叉分类2*2表的关联分析 二、2*2配对资料的关联性分析 三、R*C表分类资料的关联性分析 小结 | 幻灯片10分钟 幻灯片20分钟 幻灯片10分钟 幻灯片10分钟 幻灯片20分钟 幻灯片10分钟 幻灯片10分钟 幻灯片10分钟 幻灯片10分钟 幻灯片10分钟 |
教学进程
教学内容 | 时间分配 媒体选择 | |||||||||||||||||||||||||||||||||||||||||||||||||||
第十一章 两变量关联性分析 第一节 线性相关 linear correlation a执业兽医nalysis 相关的例子: 体重~收缩压 胰岛素~血糖水平 药物剂量~动物死亡率 父亲身高~儿子身高 姐妹身高~兄弟身高 例11-1:随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如表11-1所示。据此数据如何判断这两项指标是否相关? 表11-1 15例健康成人凝血时间与凝血酶浓度测量值记录
绘制散点图
| 幻灯片10分钟 幻灯片10分钟 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教学内容 | 时间分配 媒体选择 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||
一. 线性相关(linear correlation)的概念 直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布(bivariate normal distribution)资料。直线相关的性质可由散点图直观的说明。 0<r<1 r=1
-1<r<0 r=-1
r=0 r=0 r=0 r=0 二. 相关系数(linear correlation coefficient) 又称积差相关系数(coefficientof product-moment correlation),描述具有直线关系的两个变量之间相关关系的密切程度与相关方向的指标,以符号r表示样本相关系数。 | 幻灯片5分钟 幻灯片5分钟 幻灯片10分钟 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||
教学内容 | 时间分配 媒体选择 | |||||||||||||||||||||||||||||||||||||||||||||||||||
相关系数的计算公式
相关系数没有单位,其值为-1≤r≤1。r值为正表示正相关(positive linear correlation),r值为负表示负相关(negative linear correlation);r的绝对值等于1为完全相关,r=1为完全正相关(perfectpositivecorrelation),r=-1为完全负相关(perfect negative correlation);r=0,两变量间没有直线相关关系,称为零相关(zero correlation)。 -1≤r≤1,|r|越大,线性相关越密切。 线性相关(linear correlation):(X, Y)服从正态分布,即适用于双变量正态分布资料。 线性相关系数的计算 例11-2 计算例11-1中凝血酶浓度X与凝血酶时间Y之间样本相关系数 解: 1. 绘制散点图,如图11-1 2. 计算相关系数 由公式11-3得
三、相关系数的假设检验 上面所求的相关系数r是样本相关系数,它是总体相关系数r的估计值。要判断X、Y间是否有相关关系,就要检验r是否来自总体相关系数r为零的总体。因为即使从r=0的总体作随机抽样,由于抽样误差的影响,所得r值也常不等于零。故当计算出r值后,接着做r=0的假设检验。 | 幻灯片10分钟 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教学内容 | 时间分配 媒体选择 | |||||||||||||||||||||||||||||||||||||||||||||||||||
常用t检验,检验统计量t值的计算公式如下: , 公式中Sr为相关系数的标准误。求得t值后查t界值表得P值,按所取检验水准作出推断结论;亦可按=n-2,直接查r界值表得P值,以节省计算。 例 根据样本相关系数r=0.91,对总体相关系数r进行假设检验。 解: 1. 建立假设检验,确定检验水准 H0: р = 0 (变量间不存在线性相关关系) H1: р ¹ 0 (变量间有线性相关关系) a=0.05 2. 计算检验统计量 本例,n=15, r=-0.926,
3. 确定P值,下结论 本例v=13,查t 界值表得P<0.001,故拒绝H0,接受H1,认为凝血酶浓度与凝血酶时间之间存在负相关。此结果与查表的结果是一致的。 查表法 根据自由度df=13,查(附表13)相关系数r界值表,得r0.05/2,13=0.497,r0.01/2,13=0.623,本例r=0.926,故P<0.01,按a=0.05水准拒绝H0,接受H1。 与t检验结论相同。 第三节 线性相关中应注意的问题 • 1.样本的相关系数接近零并不意味着两变量间一定无相关性. • 2.一个变量的数值人为选定时莫作相关. • 3.出现异常值时甚用相关. • 4.相关未必真有内在联系. • 5.分层资料盲目合并易出假象. | 幻灯片10分钟 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教学内容 | 时间分配 媒体选择 | |||||||||||||||||||||||||||||||||||||||||||||||||||
第二节 秩相关 问题:(X, Y)服从正态分布,则r可以较好的估计总体相关系数 r,若( X, Y )不服从二元正态分布呢? 等级相关(rank correlation)是用双变量等级数据作直线相关分析,适用于下列资料: ①不服从双变量正态分布而不宜作积差相关分析 ②总体分布型未知 ③原始数据是用等级表示。 Spearman提出对数据作秩变换后再计算直线相关系数。 一、Spearman秩相关 rs-----Spearman秩相关系数,说明两个变量间相关关系的密切程度与相关方向,间接反映X、Y间的相关性,且不依赖X、Y的分布。
例11-4 某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析 例11-5 表11-2 急性白血病患儿的血小板(109/L)和出血症状 解:不服从正态分布,故计算Spearman秩相关。故
| 幻灯片10分钟 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教学内容 | 时间分配 媒体选择 |
1. 建立假设检验,确定检验水准 H0: pS = 0 (不存在相关关系) H1: pS ¹ 0 (有相关关系) a=0.05 2. • 查表法: 例11-4中算得rs=-0.422 查 r 临界值表,-0.422<0.503 ,按a=0.05的水准,不能拒绝H0,可以认为急性白血病患儿的出血症状与血小板数之间无相关关系。 t检验法: 计算t统计量 五、相关系数的可信区间 必须先对r作z变换 或 或 公式中tanh为双曲正切函数;tanh-1为反双曲正切函数,r的取值范围 -1<r<1,相应的z值范围 -∞〈z<+∞。按正态近似原理,z的1-可信区间的计算公式 ),即 六、相关系数应用的注意事项 1. 首选绘制散点图 2. 进行相关分析要有实际意义 3. 相关关系~因果关系 4. 必须对相关系数r作假设检验 | 幻灯片10分钟 |
教学内容 | 时间分配 媒体选择 | |||||||||
第三节 分类变量的关联性分析 •适用条件 对定性变量之间的联系通用的方法是根据两个定性变量交叉分类基数所得的频数资料(列联表)作关联性分析,即关于两种属性独立性的卡方检验 计算公式
一、交叉分类2×2表的关联分析 •例11-6 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,对每个个体分别观察腹泻与否和喂养方式两种属性,2×2种结果分类记述如表11-3所示,试分析两种属性的关联性。 表11-3婴儿腹泻与喂养方式的关系 •假设检验 H0:喂养方式与婴儿腹泻之间相互独立 H1:喂养方式与婴儿腹泻之间有关联 a=0.05 将表中各数据代入公式(7-7)得
, 拒绝原假设,说明婴儿腹泻与喂养方式之间存在关联性. 二 2×2配对资料的关联性分析 •例11-7 有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲乙两种白喉杆菌培养基上,观察白喉菌生长的情况,结果如表11-5,问两种培养基的结果有无关联? 表11-5 两种白喉杆菌培养结果 •假设检验 H0:两种培养基的结果之间互相独立 H1:两种培养基的结果之间有关联 a=0.05 将本例数据代入公式(7-7)得
有理由拒绝零假设,可以认为甲、乙两种培养基之间存在关联性 三 R×C表分类资料的关联性分析 •例11-8 某地居民主要有三种祖籍,均流行甲状腺肿。为探索甲状腺肿类型与祖籍是否有关联,现根据居民甲状腺肿筛查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表11-6的资料。问甲状腺肿类型与祖籍见有否关联? 表11-6 某地居民按甲状腺肿类型与祖籍两种属性的交叉分类表 •假设检验 H0 :甲状腺类型与祖籍无关 H1:甲状腺类型与祖籍有关联 a=0.05 同样作检验得 查界值表, ,拒绝零假设,说明甲状腺肿类型与祖籍之间有关联性 计算列联系数 小结 | 幻灯片5分钟 幻灯片10分钟 幻灯片10分钟 幻灯片10分钟 幻灯片5分钟 | |||||||||