多组数据单因素方差分析(数据分析系列1032)
无论是什么活动,影响产品质量和产品的因素都有多种,如影响农作物产量的因素有品种、天气、施肥量、肥料的种类等等。如果我们想要了解这些因素中哪些因素对产量有显著性影响,或各个因素之间的交互作用,以及对结果有显著影响的因素的最佳水平等,就必须先进行实验,再进行分析,最后做出判断。
PART
01
Excel中的方差分析
方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。
方差分析的基本步骤如下:
1、建立检验假设;
H0:多个样本总体均值相等;
H1:多个样本总体均值不相等或不全等。
检验水准为0.05。
2、计算检验统计量F值;
3、确定P值并作出推断结果。
Excel中的方差分析工具提供了不同类型的方差分析方法,如下图所示,我们可以根据要测试的样本总体中的因素数和样本数来决定要使用的方法。
PART
02
单因素方差分析实例
如果只考虑一个因素对某项实验指标的影响力是否显著,则可通过对此因素的多个水平试验结果进行比较。
单因素方差分析的第一步是明确观测变量和控制变量。
单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA SSE。
单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。
实例应用:应用单因素方差判断不同型号轮胎的刹车停止距离是否存在显著差异
1、案例描述
某轮胎生产厂家设计了5中型号的轮胎,要检验这些轮胎在平均刹车停止距离方面是否有显著差异,以便对各型号轮胎定价。该厂家选择了50辆相同的小汽车,为这5种轮胎各随机选取了10辆车,以相同的速度进行试驾测试,各型号轮胎对应的刹车距离数据如下图所示:
2、案例分析
在这个案例中,实际上是要通过试验数据分析多个样本平均刹车停止距离差异的显著性,即考虑轮胎型号对刹车停止距离的影响是否显著,所以我们在这使用单因素方差分析对此因素的多个水平进行比较。
3、操作分析
要分析单个因素对产品的影响情况,可以直接使用方差分析中的单因素方差分析工具,但需要注意α值所表示的含义,具体操作步骤如下:
第1步:选择分析工具。“数据分析”——“方差分析:单因素方差分析”。如下图所示。
第2步:设置相关参数。在弹出的“方差分析:单因素方差分析”对话框中,设置“输入区域”为“$B$1:$F$11”,点击“分组方式”的“列”单选按钮,选择“标志位于第一行”,设置“α”为“0.05”,在“输出选项”下单击“输出区域”,设置区域为“$H$2”,确定即可。设置α=0.05,表示数据有95%的可信度。
第3步:显示单因素方差分析结果。如下图所示。
4、决策分析
如上图所示,单因素方差分析的结果有两部分,第一个部分是SUMMARY,即对各个水平下的样本数据的描述统计,包括样本观测数、求和、样本平均数、样本方差。第二部分是方差分析,其中“差异源”即方差来源,SS代表平方和,df代表自由度,MS指均方,F是检验统计量,P-value是观测到的显著性水平,Fcrit是检验临界值,可通过P-value的大小来判断组件的差异显著性,通常情况下,当P值<=0.01时,则表示有极显著的差异;当在0.01和0.05之间时,表示有显著差异;当该值>=0.05时,表示没有显著差异。另外,通过F值也可以判断差异显著性,当F>=Fcrit时,表示有显著差异。
在上面的案例中,P-value=0.00674<0.01,且F=4.066>Fcrit=2.579,都说明在α=0.05的情况下,5个型号轮胎的平均刹车停止距离有显著差异,所以,该厂家可以根据,刹车停止距离对这5种轮胎定价,距离越短的定价越高。
欢迎关注公众号,访问更多精彩:数据之魅。
如需转载,请联系授权,谢谢合作。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com