excel数据分析中怎样进行统计检验(Excel数据分析z检验)
前面几天的内容理论比较多,不过所幸基本上讲得告一段落了,所以今天可以直接上个实例
比方说我们有这样一串数据:
一百七十几行的内容略微有点长,所以这里画成折线图表示:
由于本人不是那个专业领域滴人,也不想砸人家饭碗,所以就不明说这串按日期排布的数据是神马东西了,咱就老老实实的做咱的线性回归:
添加完趋势线,勾选显示y=ax b样式的公式和R平方的值(0.905),目前看起来R平方还蛮高的,貌似是个颇有前途的线性回归
由于我们接下来的计算需要算残差,那肯定要把公式y=ax b中的a值和b值弄出来,出于精确度考虑,本人是不会直接照着图上的数K进格子里做计算的,因为那会损失小数点后面的位数
在之前专门写线性回归那篇里,我有用数组公式写过a、b值的计算方法,但那个还不是最简便的,因为Excel其实有自带的函数专门用来算这两个值(不幸暴露了自己当初的傻):
常数b=INTERCEPT (y值区域, x值区域)
系数a=SLOPE (y值区域,x值区域)
当然,计算R平方的也有:R2=RSQ(y值区域, x值区域)
在这里例子中,计算结果如下:
然后,我们在源数据旁边增加两列,一列是根据直线推断出来的y值,另一列是推断值和实际值的差,也就是残差数据:
还是用图表表示,只不过这回是散点图,看起来绝大多数数值都集中在-200到 200之间,而且上下两边还算均匀
然后,现在残差值有了,那下一步怎么办呢?
理论上来说,如果我们不希望线性回归的结果和实际值有太大偏差,那肯定就想要残差尽可能的小,残差的总体平均也最好就是0,而z检验公式就是用来验证平均值的
这里抄一下书上的公式:
其中X是我们要验证的残差的平均数,u是我们期望的平均数0,S是总体标准差,n是数据的个数
因为懒得一个个打公式,这里我直接用了Excel数据分析工具里的描述性分析,一次性得到了残差数列的大致特征:
把相关的几个数据代入到z检验公式,计算出Z值:
一般取显著性水平ɑ=0.05时,Z值只要小于1.96就可以判断为两平均数没有差别了,按这里的计算结果,简直是无悬念胜出,看来,我们这个线性回归做得还算挺成功的。。。。。。但我怎么觉得这个结果有点忧伤呢~~~~~~~~
----------------------End----------------------
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com