问卷调查是怎么设计(你真的会选择样本吗)
编辑导语:问卷调查的作用主要是通过部分来推断整体情况,那么部分的选择就至关重要,选择的部分能否代表整体,决定了问卷调查的可靠性。本篇文章就从样本选择的角度出发,讲讲什么是样本框,如何进行抽样,以及如何确定最小的样本量。
一、抽样框
抽样框在抽样调查中处于基础地位,是抽样问卷调查必不可少的部分,其对于推断总体具有相当大的影响。
抽样框是用来代表总体,从中抽选样本的一个框架。具体表现形式可以是一个学生的花名册、工商企业名录等。例如:假设现在要调查全国32万所小学的学生家长对于国家“双减政策”的民意调查,从中选取出10所最具有代表性的小学,并从中抽取出10000名学生家长进行调查。
那么在这个例子中 ,总体是32万所小学的学生家长,抽样框是所选出的10所小学的学生家长名册,样本是最后抽取出的10000名学生家长。
当然抽样框也不定是具象的,也可能是抽象的,例如,在大型零售商场对购买者或消费者进行随机访问调查时,并没有具体的名册。
抽样框选取能否代表总体,直接决定了调研结果的可靠性。在我们的例子中选取10所学校家长需要能够代表全国32万所学校的学生家长,需要考虑的因素有很多,比如:收入因素、地域因素、宗教因素等等,因此在调研初期,根据调研的目的和主题尽可能确定准确的抽样框,从而减少调查的误差。
我们来看一个由于抽样框选取错误,而导致失败的案例:1936年美国总统选举民意测验。
1936年美国总统大选,竞选的是民主党的罗斯福和共和党的兰登。美国权威的《文学摘要》杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举(他们以电话簿上的地址和俱车辆注册系统的地址发出1000万封信,收到回信200万封)。预测兰登将以57%对43%的比例获胜,并大力进行宣传。
最后选举结果却是罗斯福以62%对38%的巨大优势获胜。原因是在1936年的美国,富裕的家庭才有私人电话和汽车。为了挽救大萧条造成的经济打击,当时的罗斯福政府强行干预市场经济,从而在富人中普遍缺乏好感。
因此,《文学摘要》的调查样本不是从总体(全体美国选民)中随机地抽取,而是主要从富人的抽样框中抽取,这样的调查结果当然对罗斯福不利。
在问卷领域,最关注的是“代表性”,而非数量。因此在选取样本框时,一定要从多方面因素来考虑,从而避免选取出误差较大的样本框。
也许你想问,怎么才能知道自己的样本数据是否正确。 很遗憾的告诉你,没有办法,除非调查了全部的总体,才能准确的知道自己抽取的样本是否正确。 但是没有关系,误差是会永远存在的,我们需要做的是尽可能的减少误差,而不是消灭误差。
二、抽样方法抽样是指从抽样框或总体中抽取出一部分数据作为样本的动作。抽样的方法有很多,介绍几种常见的抽样方法。
1. 简单随机抽样
一般的,设一个总体个数为N,如果通过逐个抽取的方法抽取一个样本,且每次抽取时,每个个体被抽到的概率相等,这样的抽样方法为简单随机抽样。适用于总体个数较少的。
2. 系统抽样
当总体的个数比较多的时候,首先把总体分成均衡的几部分,然后按照预先定的规则,从每一个部分中抽取一些个体,得到所需要的样本,这样的抽样方法叫做系统抽样。
3. 分层抽样
抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层中独立抽取一定数量的个体,得到所需样本,这样的抽样方法为分层抽样。适用于总体由差异明显的几部分组成。
4. 整群抽样
整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
5. 多段抽样
多段随机抽样,就是把从调查总体中抽取样本的过程,分成两个或两个以上阶段进行的抽样方法。
系统、分层、整体、多段比较难实现,在问卷调查中经常被使用到的方法是简单随机抽样。
三、如何确定最小取样数量样本量越大越好吗?样本量确实越大越好,样本越大越接近数据总体情况,但样本量越大同时也代表需要付出更多的人力和财力,所以往往出于现实因素的考虑,需要确定最少取样数量。最小取样数量公式如下:
n:样本量
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com