数据的整理与分析方差如何算(统计学中的方差分析实操)

方差分析(Analysis of Variance,简称ANOVA),用于比较多个总体的均值是否想等,由英国统计学家费希尔(Fisher)首先引入。目前已经广泛应用于分析心理学、生物学、工程和医药的试验数据。

一个例子

消费者与产品生产者、销售者或服务提供者之间经常发生纠纷。当发生纠纷后,消费者常常会向消费者协会投诉。为了对几个行业的服务质量进行评价,消费者协会在零售、旅游业、航空公司、家电制造业抽取了不同的企业作为样本。其中所抽取零售业7家、旅游业6家、航空公司5家、家电制造业5家。每个行业中抽取的这些企业,服务对象、服务内容、企业规模等方面基本上相同的。然后统计出最近一年中消费者对总共23家企业投诉的次数,结果如下表:

数据的整理与分析方差如何算(统计学中的方差分析实操)(1)

问题:我们想知道这几个行业之间的服务质量是否有显著差异?

一般来说,被投诉次数越多,说明服务质量越差。

要分析这四个行业之间的服务质量是否有显著差异,其实就是要判断行业(自变量)对被投诉次数(因变量)是否有显著影响。

相关术语

  • 因素:检验的对象,在上面的例子中指行业。
  • 水平:因素的不同表现,在上方的例子中指零售业、旅游业、航空公司、家电制造业。
  • 观测值:每个因子水平下得到的样本数据,在上方的例子中指每个行业下得到的被投诉次数(样本数据)。
方差分析的基本原理

1、图形描述

绘制出被投诉次数和行业的散点图,如下图所示。

数据的整理与分析方差如何算(统计学中的方差分析实操)(2)

从散点图可以看出,不同行业被投诉的次数是有明显差异的,而且,在同一个行业,不同企业被投诉的次数也明显不同。例如,家电制造业被投诉次数最多,航空公司被投诉次数较少,表明行业与被投诉次数之间有一定的关系。

说明:上方的图形通过Excel绘制,绘制折线图,然后调整样式。

2、误差分解

仅仅从散点图上观察还不能提供充分的证据证明不同行业被投诉次数之间有显著差异,也许这种差异是由抽样的随机性造成的,因此,需要更加准确的方法来检验这种差异是否显著,也就是所谓的方差分析。

在方差分析中,误差通过平方和来表述。

  • 反应全部数据误差大小的平方和为总平方和,记为SST
  • 反应组内误差大小的平方和称为组内平方和,也称为误差平方和或者残差平方和,记为SSE
  • 反应组间误差大小的平方和称为组间平方和,也称为因素平方和,记为SSA
  • 总误差(SST)=组内误差(SSE) 组间误差(SSA)

数据的整理与分析方差如何算(统计学中的方差分析实操)(3)

单因素方差分析

根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。当方差分析中只涉及一个分类型自变量时称为单因素方差分析。

单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,例如前面的例子,分析这四个行业之间的服务质量是否有显著差异。

方差分析分为三步:

1、提出假设

2、构造检验的统计量

3、统计决策

具体操作如下:

第1步:提出假设

数据的整理与分析方差如何算(统计学中的方差分析实操)(4)

第2、3步:构造检验的统计量及统计决策,具体计算公式及相关理论如下:

数据的整理与分析方差如何算(统计学中的方差分析实操)(5)

说明:Excel、SPSS等分析工具可以直接给出分析结果,所以具体计算及理论可不必深究!

用Excel做单因素方差分析

下面通过单因素方差来解决前面提出的问题:

问题:我们想知道这几个行业之间的服务质量是否有显著差异?

第1步:提出假设

数据的整理与分析方差如何算(统计学中的方差分析实操)(6)

第2、3步:构造检验的统计量及统计决策,这里通过Excel数据分析库直接给出,具体操作如下。

这里需要用到Excel中的“数据分析”库,需要设置才能显示出来,设置方法如下。

1、文件-选项,打开如下对话框,选择加载项

数据的整理与分析方差如何算(统计学中的方差分析实操)(7)

2、选择“Excel加载项”,单击按钮“转到”,勾选分析工具库、分析工具库-VBA

数据的整理与分析方差如何算(统计学中的方差分析实操)(8)

经过以上操作,Excel中的“数据”标签最右侧会出现“数据分析”按钮。

下面通过Excel里面的“数据分析”库进行单因素方差分析:

1、单击“数据”-“数据分析”

数据的整理与分析方差如何算(统计学中的方差分析实操)(9)

2、选择“单因素方差分析”

数据的整理与分析方差如何算(统计学中的方差分析实操)(10)

3、输入区域,选择数据区域,选择范围如下图红色框线指示的区域,勾选“标志位于第一行”(因为我们选择的区域包含字段名),输出区域选择下方任意空白处

数据的整理与分析方差如何算(统计学中的方差分析实操)(11)

4、单击确定后,Excel会直接给出单因素方差分析的结果

数据的整理与分析方差如何算(统计学中的方差分析实操)(12)

分析结果说明:

Excel给出的分析结果分两块:

1、SUMMARY(概述)

数据的描述性统计量:观测数、求和、均值和方差。

2、方差分析表

关于方差分析的相关结论:

  • 组间误差、组内误差和总误差。
  • 自由度。
  • 组间方差、组内方差。
  • P值和F值。

说明:从前面可以看出,进行方差分析需要进行大量的计算工作,手工计算十分繁琐,通过Excel数据分析库可以很轻松地得到结论。

统计决策:

这里主要关注最后的P值,如果P较小(指小于0.05),则拒绝原假设,反之,则接受原假设。

这里看到P值约为0.04,比较小,所以拒绝原假设,即不同行业的被投诉次数的均值不完全相同。

结论:不同行业的被投诉次数的均值不完全相同,即行业对被投诉次数的影响是显著的。

你是否用过方差分析呢?通过什么工具来做方差分析呢?欢迎留言评论!

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页