3.2 假定性 假设毕竟是经过科学思维作出的推测性设想,且设想的是一个未知的问题,这种设想仅为一种假定性说明,它具有不确定的性质,在医学研究课题中尤其这样。因生物体是一个复杂的有机体,内外环境的影响因素较多,假设的不确定性成分更大。假设的表达形式可以是一元或多元的。现在电脑的普及、软件SPSS和SAS的广泛应用,为解决多元分析验证多元假设提供了广阔的空间和便利。
3.3 预见性 假设的预见性是假设价值的体现,假设的提出具有可验证性。实践是检验真理的唯一标准,同样适用于医学科研工作。例如:1997年诺贝尔物理学奖获得者朱棣文创立的激光电子冷凝学说经过了10年时间的验证,证实了该成果的应用将对化学、物理和医学诸多领域产生深远、巨大的影响。
3.4 曲折性 完整和真实的假设形成,一般不可能一次完善,大多数要经过若干次假定→检验→再假定→再检验,根据检验的客观证据,不断修改与补充,才能逐步完成。在验证假设时,有的假设可能被否定,有的假设可能起到了提示、启发和桥梁的作用。所以,一个正确假设的建立,往往需要经历实践→认识→再实践→再认识的一个螺旋式发展过程。
4 假设检验的分类
假设形成以后,研究者就须着手设计和实验(包括调查和观察等)来验证这种假设。其后续工作包括确定观察对象和指标。所取指标是在研究目的指导下进行分类(定量、定性或是等级)、采用相对应的统计方法来验证这种假设。统计学的主要任务是统计描述和统计推断,统计推断又包括参数估计和假设检验。参数估计即对某变量的总体特征进行区间估计(例如μ,π,σ,β,ρ等)。医学全.在线网.站.提供
4.1 按参数性质分类 假设检验是根据样本值来判断随机变量是否服从某种分布函数,或判断某一样本是否由某一已知参数的总体中产生。前者称为总体中的个体值分布检验,后者称为总体的参数检验。
进行假设检验时,一般从样本值出发判断某“假设”是否成立。例如以样本的均数与方差作为参数的点值估计值,拟合正态分布,然后检验样本的频数分布与正态分布的假设是否矛盾,这就是拟合优变检验。又如已知两个正态总体的方差相等(数理统计模型的要求),以,2作为总体均数的估计值,检验μ1=μ2是否成立,这就是两个均数差别的假设检验。
4.2 按检验性质分类 假设检验按其检验性质可分为简单假设与复合假设。设有一个分布相依于多个参数,如果某一假设对于这些参数中每个参数分别指定了唯一的值,则称为简单假设。例如标准正态分布中指定其均数等于零、标准差等于1。如果只给一部分参数分别指定了唯一的值,剩下若干个参数未指定,则称为复杂假设。这类方法在多元分析中被广泛采用。
5 假设检验的基本程序
当你对假设检验的目的和方法已经明了和熟悉的条件下,不妨列举一个简单的医学例子予以说明。生理学已经证实:血液中血糖浓度下降,通过神经反射,产生饥饿感觉,空腹时间越长这种饥饿感越强烈。在未证实之前,生理学家肯定曾探索和验证这样一些假设:血糖浓度是否与空腹时间长短有关,饥饿程度是否与血糖浓度有关,餐饮前后血糖浓度是否相同。若选用后者的假设进行检验,则餐饮前后血糖浓度作为观察指标,被试因素为用餐条件,被试对象为正常人(排除了一切影响血糖浓度的疾病、药物等因素);且假定血糖值在人群中服从正态分布。上述现象可采用自身配对设计且符合配对t检验的条件。具有事实依据和理论基础两大支柱的保障,可以进行假设。
5.1 建立假设 ①进餐不会影响血糖浓度的高低,即处理因素无效。假设是对总体特征的表述。本例推论的总体是假定的,包括无数个受试者进餐前后血糖值的差值,差值以d表述,差值的总体均数以μd表述,因而可写成Ho:μd=0。H示Hypothesis,0示Null(Null无效,零的意思)。H0又称为零假设、无效假设或原假设。②备择假设:H1:μd≠0,即进餐会影响血糖浓度的高低(处理因素有效)。H1不等于零表示研究者在建立假设时不知道处理因素能否引起效应指标(血糖值)升高或者降低,因而称为双侧检验。如果认为只会引起升高则H1:μd>0;反之下降则H1:μd<0。这两种情况称为单侧检验。如何确定单双侧问题完全依赖于研究者密切结合本专业和他人经验来决定,它产生于假设形成的过程中。③H1是与H0相联系而对立的条件,不是平行的条件。H0是验证的主题,研究者是站在H0的角度去分析、认识事物或现象,只有在H0被拒绝的情况下才接受H1。④确定α的大小,α是在H0条件成立的情况下,允许将无差别的事物判断为有差别的概率大小。一般定为0.05,根据研究目的等条件可以取大或取小。⑤H0和H1的具体表述随变量性质、分析目的、设计类型和检验方法而异。如上例属配对设计、数值变量且符合正态分布,宜作单侧的t检验(进餐只会引起血糖值升高)。
以上是参数法检验,对总体特征的推断须落实到参数μd,有时还可落实到其它参数如σ,ρ,β等。若为非参数法检验,则对总体特征推断落实到分布类型。
5.2 检验统计量 计算检验统计量的目的在于验证假设的真实性。①无论参数法或非参数法检验,都是以统计量的分布为推理依据的。样本的统计指标称为统计量,而检验统计量的意义是在H0条件指导下,统计量与假设的参数之差相当于抽样误差(标准误)的倍数。此值已消除了原来单位且标准化了,标准化的目的在于比较现有事物与假设事物之间有无差别。如本例,式中为血糖值差值的样本平均数,μd为差值的总体均数,假设它等于零(处理因素无作用),S为差值的样本均数的标准误(表示抽样误差的大小),Sd为差值的样本标准差(表示个体差值的变异程度),n为样本含量。上例只抽取了一个样本,且计算了一个t值,在H0条件成立下(μd=0),可以重复抽取无数个样本,那么可以计算出无数个t值,它们就构成了t分布。t分布的决定系数是自由度(υ),υ=n-1。意思就是说样本含量不同其t分布曲线的形态就不同。②推理的基本思想是反证法。意思是如果在某一统计量的概率分布中,抽得现有样本统计量甚至更大的统计量的概率P值很小,就可以怀疑样本数据与所设H0有矛盾,而这种矛盾不能用抽样误差来解释,故拒绝H0;相反,若抽得现有样本统计量甚至更小的统计量的概率P值较大,也就是样本数据与所设H0虽不一致,但仍可用抽样误差来解释,就没有理由拒绝H0。③确定P值的大小,P值的大小取决于α值(在建立假设时确定的检验水准),自由度υ和现有的检验统计量(本例为t值),三者的关系依赖于数理统计理论推算出来的界值表。当α值和自由度一定时,就可查到对应的界值(在t值表中)。如本例的界值可写为tα,υ然后以计算出来的t值与界值比较。若t>tα,υ则P≤α;若tα。