随机化需要一定的技术来实现,“随机”不等于随意或随便。从口袋里摸取有号码的纸团,结果不会得到满意的随机样本。抽签法或掷钱法在原则上虽是可取的,但实用的价值很小。
对于学生或战士等有组织的人员,可利用徽章号码分组。例如分3组时,可以3除以各人的号码数,按余数1、2、及0分为3组。如须分4组,则以4除号码数,按余数1、2、3及0分为4组。
有组织的人群亦可排成单行(不按身高为顺序),分2组时以“1~2报数”,分成2排;分3组时,“1~3报数”,余类推。医学全在线网站www.med126.com
对没有组织人,可按出生月份的单双数分为2组。如须分为3组,可以1、2、3、4月出生的为第一组,5、6、7、8月为第二组,其余为第三组。
亦可将岁数加出生月份合得一数,用组数除之,余数为1的编入第一组,余数为2的编入第二组,余类推,无余数的以除数代余数。
使用随机数字表是比较简单而可靠的随机化方法。
用法举例:自500名学生中随机抽查100名在服驱虫药后排出的蛔虫数。自随机数表取出500个四位数记在学生卡片上,按随机数大小将卡片排列成序,以开头100张或末尾100张卡片为样本,或每5张卡片抽1张卡片为样本。
(2)系统抽样(systematic sampling):即按一定比例或一定间隔抽取调查单位的方法。首先确定抽样范围和样本含量,并给每一单位依次编号。然后确定抽样比,即确定每隔多少单位中抽取一个单位进入样本。至于究竟抽其中第几个,则须用随机方法决定,就是在从1至n个数中,随机选出一个数,把它作为起点,以后顺次每n个单位选一个单位进入样本。例如某乡有5000户,二万人口,今欲抽查1/5的人口可用系统抽样,每5户抽一户,抽到的户每个成员都要调查。决定起点应是随机的。
用系统抽样得到的样本,其代表性较有保证,因为构成样本的单位是从分布在总体各个部分的单元中按一定比例抽取出来的。但是必须事先对总体的结构有所了解,才能最恰当地应用系统抽样。
(3)分层抽样(stratified sampling):把总体按若干标志或特征(例如性别、年龄、居住条件、文化水平等)分成若干层,然后在每层中抽取调查单位,再合成为总体的一个样本,这种方法称分层随机抽样。具体抽样方法可用简单随机抽样法或系统抽样法。由于各层次之间的差异已被排除,其抽样误差较其他抽样为小,代表性亦较好。各层若按一定比例抽样,则称按比例分层抽样。但各层内变量的变异很大时,分层抽样的益处不大。例如按年龄分层,没有考虑各层男女比例的差异很大,如果差异很大,就不能算好的分层。层间差异大,层内差异小最适合分层抽样。
(4)整群抽样(cluster sampling):就是从总体中随机抽取若干群对象(如学校、工厂、村庄等),对整群内所有调查单位进行调查,称之整群抽样。例如调查20所小学约10000名小学生某疾病的现患率,现拟抽查1/5的数量,如用单纯随机抽样方法抽到对象分散在各所小学,调查很不方便;但若随机抽取4所小学,抽到的学校学生全部调查,则方便多了。本法易被群众接受。整群抽样的缺点是抽样误差较大。
(5)多级抽样(multistage sampling):是进行大规模调查时常用的一种抽样方法。实质上是上述抽样方法的综合运用。从总体中先抽取范围较大的单元,称为一级抽样单元(例如省、自治区、直辖市)再从每个抽中的一级单元中抽取范围较小的二级单元(县或街道),最后抽取其中部分范围更小的三级单元(村或居委会)作调查单位。在大规模调查时可按行政区域逐级进行。我国进行的慢性病大规模现况调查大多采用此方法。
5.抽样调查样本大上的估计在抽样调查时,样本过大可造成浪费,且由于工作量过大,不能保证调查质量而使结果出现偏倚。样本过小则没有代表性。样本大小取决于:
(1)如果研究单位之间的变异较大,样本则要大些,如其间均衡性较好,则样本可以小些;
(2)在调查的人群中,欲调查某疾病的现患率,如现患率低,则样本量要大。反之,样本可小些;
(3)调查要求的精确度高些,样本量就要大。反之,样本量不必过大;