第十章基于秩次的非参数检验
参数:描述总体的指标称为参数。
参数统计:许多统计推断方法,要求来自总体分布型是已知的,在这种假设基础上,对总体进行统计推断(进行估计和检验)称为参数统计。
非参数检验:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法称为非参数检验。
参数统计内容:
•参数估计:1.正态分布的均数和方差(μ和σ)
•2.二项分布的总体率π
•3.泊松分布的均数λ
•与参数有关的检验:1.t检验
• 2.F检验
• 3.相关系数检验
• 4.回归系数检验
非参检验的优缺点:
•优点:1、计算简单便于掌握。
• 2、应用范围广。
• 3、收集资料方便。
•缺点:1、损失信息。
• 2、检验效率低。
非参数适用哪些资料:
•1、分布型未知
•2、能以严重程度、优劣等级、效果大小和名次先后等等级资料。
•3、分布极度偏态。
•4、本组内个别变量值偏离过大,远离本组其它变量值。
•5、方差不齐时。
•6、筛选或只需获得初步结果。
第一节 配对设计和单样本资料的符号秩和检验(Wilcoxon配对法)
一、配对设计资料的符号秩和检验
例10-1 某研究欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随机分到保健食品两个不同的剂量组,过一定时期将小鼠杀死,测得其肝中糖原含量(mg/100g),结果见表10-1,问不同剂量组的小鼠肝糖 原含量有无差别?
表10-1 不同剂量组的小鼠肝糖 原含量(mg/100g)
小鼠号 | 中剂量组 | 高剂量组 | 差值d | 差值为正 | 差值为负 |
(1) | (2) | (3) | (4) | 秩次(5) | 秩次(6) |
1 | 620.16 | 958.47 | 338.31 | 10 | |
2 | 866.50 | 838.42 | -28.08 | -5 | |
3 | 641.22 | 788.90 | 147.68 | 8 | |
4 | 812.91 | 815.20 | 2.29 | 1.5 | |
5 | 738.96 | 783.17 | 44.21 | 6 | |
6 | 899.38 | 910.92 | 11.54 | 3.5 | |
7 | 760.78 | 758.49 | - 2.29 | -1.5 | |
8 | 694.95 | 870.80 | 175.85 | 9 | |
9 | 749.92 | 862.26 | 112.34 | 7 | |
10 | 793.94 | 805.48 | 11.54 | 3.5 |
•1、检验步骤:
•(1)假设:H0:差值总体中位数Md=0
•H1: Md≠ 0
•(2)求差值:
•(3)编秩:
•(4)求秩和并确定检验统计量:分别求正负秩次之和,正秩次的和以T+表示,负秩次的和以T-表示.本例T+为48.5,T-为6.5,以绝对值较小秩和作检验统计量,本例取T=6.5.当n小于等于50时,查T界值表.注意:
•当n<5时,应用秩和检验不能得出双侧有统计学意义的概率故n必须大于或等于5
3、正态近似法:
•若n>50超过附表9的范围,可用u 检验。
式中tj:第j个相同差值的个数,假定差值中有2个4,5 个6,3个7则t1=2, t2=5,t3=3,
本法基本思想:
假定从一总体中随机抽取n=5 的样本,按例题9.1的方法和步骤,可求出T+、T-,当重复抽取所有可能组合情况.如T=5可有三种情况,一是最大的差值为正,其余4个为负,故正秩和等于5;二是差值的绝对值排在第一位及第四位,其余为负,即T=1+4;二是差值的绝对值排在第三位和第二位,其余为负,即T=2+3。
由此可看出T分布为以均数为中心对称的非连续分布。随着n值的增大,T的分布逐渐接近均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的正态分布(n>25),即然为正态分就可按正态分布的原理进行T的推断。
• 若单组随机样本来自正态总体,比较其总体均数与常数是否不同,可t检验若样本来自非正态总体或总体分布无法确定,也可用Wilcoxon符号秩和检验,检验总体中位数是否等于某已知数值。
•例10-2 已知某地正常人尿氟含量中位数为2.15mmol/L。今在该地某厂随机抽取12名工人测得尿氟含量(mmol/L),结果见表10-2。问该厂工人的尿氟含量是否高于当地正常人?
表10-2 12名工人尿氟含量(mmol/L)测定结果
尿氟含量 | 差值d | 秩次 |
(1) | (2) | (3) |
2.15 | 0 | |
2.10 | -0.05 | -2.5 |
2.20 | 0.05 | 2. 5 |
2.12 | -0.03 | -1 |
2.42 | 0.27 | 4 |
2.52 | 0.37 | 5 |
2.62 | 0.47 | 6 |
2.72 | 0.57 | 7 |
2.99 | 0.84 | 8 |
3.19 | 1.04 | 9 |
3.37 | 1.22 | 10 |
4.57 | 2.42 | 11 |
•1、检验步骤:
•(1)假设:H0:差值总体中位数Md=0
• H1: Md≠0
•(2)求差值:
•(3)编秩:
•(4)求秩和并确定检验统计量:分别求正负秩次之和,正秩次的和以T+表示,负秩次的和以T-表示.本例T+为62.5,T-为3.5,以绝对较小秩和作检验统计量,本例取T=3.5.当n小于等于50时.
•(5)确定P值并做出推断结论,查T界值表.
•,得P<0.005,按a=0.05水准,拒绝H0,接受H1,可认为该厂工人尿氟含量高于当地正常人。
第二节 完全随机化设计两独立样本比较的秩和检验
(Wilconxon两样本比较法)
一、两组连续变量资料的秩和检验
完全随机化设计两独立样本比较的秩和检验,目的是推断两样本分别代表的总体分布是否不同。
例10-3 在河流监测断面优化研究中,研究者从某河流甲乙两个断面分别随机抽取10个和15个样品,测得其亚硝酸盐氮(mg/L)的含量如表10-3,问比较甲乙两河流断面亚硝酸盐氮 的含量有无差别?
表10-3 某河流甲乙断面亚硝酸盐氮含量 (mg/L )的含量
亚硝酸盐氮含量 | 秩次 | 亚硝酸盐氮含量 | 秩次 | 亚硝酸盐氮含量 | 秩次 |
0.014 | 1.0 | 0.018 | 2.5 | 0.036 | 17.0 |
0.018 | 2.5 | 0.019 | 4.0 | 0.037 | 18.0 |
0.024 | 8.5 | 0.020 | 5.0 | 0.055 | 21.0 |
0.025 | 10.5 | 0.022 | 6.0 | 0.064 | 22.5 |
0.027 | 12.0 | 0.023 | 7.0 | 0.067 | 24.0 |
0.034 | 15.0 | 0.024 | 8.5 | ||
0.038 | 19.0 | 0.025 | 10.5 | ||
0.043 | 20.0 | 0.028 | 13.0 | ||
0.064 | 22.5 | 0.030 | 14.0 | ||
0.100 | 25.0 | 0.035 | 16.0 |
(1)假设:H0:两组总体分布相同
H1:两组总体分布不同 α=0.05
(2) 编秩:
(3) 求秩和并确定检验统计量:
(4)确定P值和作出推断结论:当样本例数不等时,以样本例数小的那个组的秩次之和为统计量T,当两组样本例数相等时,可任取一组的秩次之和为统计量T.本例河流甲断面的样本例数为10,河流乙断面的样本例数为15,检验统计量就为136.然后查,T界值表.
正态近似法
•如果n1或n2-n1,超出附表范围,可按正态近似计算u值
二、有序变量资料(或等级资料)的两样本比较
•例10-4 某研究者欲评价新药按摩乐口服液治疗高甘油三酯血症的疗效,将高甘油三酯血症患者189例随机分为两组,分别用按摩乐口服液和山楂精降脂片治疗,数据如表10-4,问两药物治疗高甘油三酯血症的疗效有无不同?
表10-4 两种药物治疗甘油三酯血症的疗效
疗效 | 人数 | 秩次 范围 | 平均秩次 | 秩和 | |||
按摩乐 口服液 | 山楂精 降脂片 | 合计 | 按摩乐口服液 | 山楂精 降脂片 | |||
(1) | (2) | (3) | (4) | (5) | (6) | (7) | (8) |
无效 | 17 | 70 | 87 | 1~87 | 44 | 748 | 3080 |
好转 | 25 | 13 | 38 | 88~125 | 106.5 | 2662.5 | 1384.5 |
显效 | 27 | 37 | 94 | 126~189 | 157.5 | 4252.5 | 5827.5 |
合计 | 69 | 120 | 189 | 7663 | 10292 |
(1)假设:H0:两组药物总体分布相同
H1:两组药物总体分布不相同 α=0.05
(2) 编秩:
(3) 求秩和并确定检验统计量:
(4)确定P值和作出推断结论:
第三节 完全随机化设计多个样本的秩和检验
一、多组连续变量资料的秩和检验
例10-5 某研究者欲研究A、B两菌种对小鼠巨噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?
表10-5 不同菌种对小鼠巨噬细胞的吞噬指数
吞噬 指数 | 秩次 | 吞噬 指数 | 秩次 | 吞噬指数 | 秩次 | 吞噬 指数 | 秩次 | 吞噬 指数 | 秩次 | 吞噬 指数 | 秩次 |
1.30 | 1.0 | 2.30 | 26.5 | 1.80 | 14.5 | 2.68 | 44.5 | 1.50 | 4.0 | 2.60 | 40.0 |
1.40 | 2.0 | 2.30 | 26.5 | 1.80 | 14.5 | 2.70 | 47.0 | 1.80 | 14.5 | 2.60 | 40.0 | www.lindalemus.com/sanji/
1.50 | 4.0 | 2.30 | 26.5 | 2.20 | 20.5 | 2.80 | 49.5 | 1.80 | 14.5 | 2.60 | 40.0 |
1.50 | 4.0 | 2.40 | 33.5 | 2.20 | 20.5 | 3.00 | 49.5 | 1.80 | 17.0 | 2.70 | 47.0 |
1.60 | 6.5 | 2.40 | 33.5 | 2.20 | 20.5 | 3.10 | 51.0 | 2.00 | 26.5 | 2.70 | 47.0 |
1.60 | 6.5 | 2.20 | 20.5 | 3.10 | 54.5 | 2.30 | 26.5 | 3.10 | 54.5 | ||
1.70 | 10.0 | 2.30 | 26.5 | 3.10 | 54.5 | 2.30 | 33.5 | 3.10 | |||
1.70 | 10.0 | 2.30 | 26.5 | 3.10 | 54.5 | 2.40 | 33.5 | ||||
1.70 | 10.0 | 2.30 | 26.5 | 3.20 | 54.5 | 2.40 | 33.5 | ||||
1.70 | 10.0 | 2.66 | 42.5 | 4.30 | 58.0 | 2.40 | 33.5 | ||||
1.70 | 10.0 | 2.66 | 42.5 | 4.30 | 29.5 | 2.40 | 37.5 | ||||
2.10 | 18.0 | 2.68 | 44.5 | 4.30 | 59.5 | 2.50 | 37.5 | ||||
Ri | |||||||||||
ni |
(1)假设:H0:三个总体分布相同.
H1:三个总体分布不同或不全相同. α=0.05
(2) 编秩:
(3) 求秩和并确定检验统计量
(4)确定P值和作出推断结论
计算检验统计量H值:
H值的校正:
确定P值和作出统计推断结论
•若组数等于k=3,每组例数小于等于5时,可查H界值表得出P值。若最小样本数大于5时,或组数大于3时则H分布近似服从n=k-1卡方分布,查卡方界值表,得出P值。本例每组样本例数均大于5,所以查卡方界值表,其自由度为2,得P<0.005.按0.05水准拒绝H0,故认为三个不同菌种对小鼠巨噬指数的作用有差别.
二、多个样本比较的有序资料的秩和检验
•例10-6 四种病人痰液内嗜酸性粒细胞的检查结果见表10-6。问四种疾病患者痰液内嗜酸粒细胞的等级有无差别?
表10-6四种疾病痰液嗜酸粒细胞等级比较
- | 0 | 3 | 5 | 3 | 11 | 1~11 | 6 | 0 | 30 | 30 | 18 |
+ | 2 | 5 | 7 | 5 | 19 | 12~30 | 21 | 42 | 147 | 147 | 105 |
++ | 9 | 5 | 3 | 3 | 20 | 31~50 | 40.5 | 364..5 | 202.5 | 121.5 | 121.5 |
+++ | 6 | 2 | 2 | 0 | 10 | 51~60 | 55.5 | 333 | 111 | 111 | 0 |
合计 | 17 | 15 | 17 | 11 | 60 | _ | _ | 739.5 | 436.5 | 409.5 | 244.5 |
第四节 随机区组设计资料的秩和检验
随机区组设计的秩和检验(M检验(Friedman)、F检验)
例10-7 欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济、地位、学习动机相同和智力水平、学习情况相近作为配对条件,将4名学生分一组,共8组,每区组的4名学生随机分到四种不同的教学实验组,经相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对学习成绩的综合评分影响有无不同?
表10-7 不同区组4种教学方式对学生学习综合评分比较
区组编号 | 教学方式A | 教学方式B | 教学方式C | 教学方式D | ||||
综合评分 | 秩 | 综合评分 | 秩 | 综合评分 | 秩 | 综合评分 | 秩 | |
1 | 8.4 | 1 | 9.6 | 2 | 9.8 | 3 | 11.7 | 4 |
2 | 11.6 | 1 | 12.7 | 4 | 11.8 | 2 | 12.0 | 3 |
3 | 9.4 | 2 | 9.1 | 1 | 10.4 | 4 | 9.8 | 3 |
4 | 9.8 | 2 | 8.7 | 1 | 9.9 | 3 | 12.0 | 4 |
5 | 8.3 | 2 | 8.0 | 1 | 8.6 | 3.5 | 8.6 | 3.5 |
6 | 8.6 | 1 | 9.8 | 3 | 9.6 | 2 | 10.6 | 4 |
7 | 8.9 | 1 | 9.0 | 2 | 10.6 | 3 | 11.4 | 4 |
8 | 8.3 | 2 | 8.2 | 1 | 8.5 | 3 | 10.8 | 4 |
Ri | 12 | 15 | 23.5 | 29.5 |
M检验(Friedman法)
计算步骤:
1、将每个区组的数据由小到大分别编秩,遇相同数据取平均秩次:
2、计算各处理组的秩和Ri:
3、求平均秩: b:区组数;k:处理组数;
4、 计医学考研网算各处理组的 ;
5、求M:
6、 1)查表法:查M值界值表(附表12),M大于或等于表中数据则差别有统计意义.
2)卡方分布近似法:
当处理组数k或区组数b超出M界值表的范围时,可采用近似卡方分布法:Rj第j处理组的秩和,故总秩和为
当H0成立时,第j列秩的期望与方差为:
大样本时,统计量近似服从标准正态分布;但k个Zj的加权和服从自由度为K-1的卡方分布,
当各区组秩次较多时,需校正公式:
第五节 多个样本两两比较秩和检验
•无论是对完全随机设计多个样本比较,还是对随机化区组设计的多个可样本比较,当经过多个样本比较的秩和检验拒绝H0,认为各总体分布位置不同或不全相同时,常需作两两比较的秩和检验是否相同,以判断哪两个总体分布相同,哪两个总体分布不同.
•一、完全随机设计多个样本间的多重比较
•例10-8 以例10-5说明对完全随机设计资料进行多重比较的步骤
•它的步骤为:
1、检验假设
H0:第i组与第j组所代表的总体中位数相同
H1:第i组与第j组所代表的总体中位数不相同
2、计算检验统计量并确定P值 设Ri和Rj分别为比较的第i组和第j组样本的秩和,其平均秩和分别为
1)精确法
2)正态近似法:样本含量较大时,计算统计量:
3、做出统计推断结论 将某两组比较所得P值与调整以后的检验 水准 比较,若P< ,则拒绝H0。
4、检验水准的调整
通常有两种情况:
1)多组间的两两比较
2)实验组与同一对照组的比较
表10-5的资料进行两两比较,按a=0.05总的检验水准,每次比较必须采用调整的检验水准
表10-8 三组样本秩和的两两比较
对比组 | P | |||
(1) | (2) | (3) | (4) | (5) |
对照组与A菌组 | 25.8248 | 5.5362 | 4.66 | <0.002 |
对照组与B菌组 | 19.3917 | 5.8304 | 3.33 | <0.002 |
B菌组与A菌组 | 6.4331 | 5.3629 | 1.20 | >0.200 |
•二、随机区组设计多个样本间的多重比较
•对于随机区组设计资料,当拒绝H0,认为各总体分布位置不同或不全相同时,同样需对各处理间进行多重比较,与完全随机设计秩和检验多重比较类似,只是正态近似检验中的估计方差的算法不同。
•现通过例10-7说明基的方法和步骤:
1、检验假设
H0:任两组学习成绩综合评分总体中位数相同
H1:任两组学习成绩综合评分总体中位数不相同
2、计算检验统计量并确定P值 设Ri和Rj分别为比较的第i组和第j组样本的秩和,其平均秩和分别为
1)精确法
2)正态近似法:样本含量较大时,计算统计量:
3、做出统计推断结论 将某两组比较所得P值与调整以后的检验水准 比较,若P< ,则拒绝H0。
4、检验水准的调整
表10-7的资料进行两两比较,按a=0.05总的检验水准,每次比较必须采用调整的检验水准
表10-9 不同教学方式间的两两比较
对比组 | P | |
(1) | (2) | (3) |
方式A与方式B | 4.66 | >0.5 |
方式A与方式C | 2.23 | 0.01<P<0.05 |
方式A与方式D | 3.39 | <0.0017 |
方式B与方式C | 1.65 | >0.05 |
方式B与方式D | 2.81 | 0.0017<P<0.0083 |
方式C与方式D | 1.16 | >0.2 |
第八节 小结
1、检验方法的选择:
1)一组样本资料
2)配对设计资料
3)两独立样本
4)多组独立样本
5)随机区组设计
2、检验功效