分层抽样的实施方法(如何运用分层随机抽样对企业海量差异化数据整合分析)

分层抽样的实施方法(如何运用分层随机抽样对企业海量差异化数据整合分析)(1)

当企业管理者面对总体规模N与样本容量n都较大时,总体单元之间的差异也较大时,进行简单随机抽样将会出现成本很高而精度很低的情况,也就是说,这些情况下不宜采用简单随机抽样。此时,一种自然的解决之道是:首先应设法缩小总体规模N与需要抽取的样品数目n,这可以通过将总体划分为若干子总体达到目的;其次应尽量减少总体单元之间的差异,较为有效的办法是将总体依照与调查研究最为关注的变量高度相关的指标划分成几个子总体,这些子总体与通常的组只是叫法不同,同样满足组内差异小、组间差异大的分组原则。

假如在各个子总体内已经满足实施简单随机抽样的条件,则可以通过两个步骤来实现既定目标:一是在各个子总体内独立地进行简单随机抽样,以较高的精度估计出所在子总体的参数;二是将各个子总体参数的估计值进行加权,最终整合得到总体参数的估计。这就是分层随机抽样对企业海量差异化数据整合分析的总体思路。下面举例说明:

某餐厅对顾客的特定菜品年消费支出,以会员顾客为抽样单位,根据收入水平将居民划分为4层,每层按简单随机抽样抽取10人,调查所获得的数据如下表所示,请估计该餐厅会员特定菜品年消费总支出及其95%的置信区间。

分层抽样的实施方法(如何运用分层随机抽样对企业海量差异化数据整合分析)(2)

根据上表,计算得出下表结果:

分层抽样的实施方法(如何运用分层随机抽样对企业海量差异化数据整合分析)(3)

分层抽样的实施方法(如何运用分层随机抽样对企业海量差异化数据整合分析)(4)

1. Yst估计=209650

2. 估计量方差V(Yst估计)的无偏估计为v(Yst估计)=5.386×108

3. v(Yst估计)的标准差=23207.6

4. Yst估计的95%的置信区间为:164163元~255137元

因此,可以有95%的把握认为,该地区居民特定菜品的年消费总支出在164163元~255137元之间。

(作者系国际数控管理专家李颖)

分层抽样的实施方法(如何运用分层随机抽样对企业海量差异化数据整合分析)(5)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页