总结比较样本均值的抽样分布形式(统计起源第五讲)

黑暗天才费歇尔本科的时候就在《生物统计》上发表了一篇短文(应当就是戈赛特递给卡尔.皮尔逊的那篇),前面讲到,卡尔.皮尔逊的师父高尔顿提出了一个回归的概念,为了描述回归又搞出一个相关系数来。卡尔.皮尔逊就把这个相关系数的分布问题介绍给了黑暗天才费歇尔。这位老皮尔逊也许本来只是想用这个复杂的问题压一压天才的锐气,没想到我们的黑暗天才不到一周就搞定了。费歇尔在《生物统计》上投了稿,但是卡尔.皮尔逊却看不懂里面的数学,卡尔.皮尔逊叫来“学生”戈赛特,“学生”也是一脸懵逼。于是费歇尔的这篇文章就被扣下了,同时老皮尔逊的助手开始计算那张庞大的分布表。一年多以后,老皮尔逊发表了这个分布表,而费歇尔的工作只是作为脚注出现。这就好比你本来有一篇顶刊一作,最后被杂志社主编坑了,变成了不知道多少作了。从此费歇尔再也没有在《生物统计》上发表过文章,并且开始了与卡尔.皮尔逊的互黑之路,互相指责对方的工作有问题。我们可以想象当年一老一小对着统计问题开始互黑“我们这本来挺真实的统计学咋就被你搞成个玄学?”“自由度都搞不清楚就在那里画表?”

总结比较样本均值的抽样分布形式(统计起源第五讲)(1)

统计学总是有一堆表,图中所示是标准正态分布的表,以后我们会用到

两个人在统计方面处处存在分歧。其中很重要的一条就是卡尔.皮尔逊认为分布是真实的,而费歇尔认为总体的分布并不真实存在,只能用样本统计量来估计,并且每次估计都有误差(这跟“学生”戈赛特的想法类似,费歇尔把戈赛特的t体检的思想给一般化了)。老皮尔逊的想法就是收集足够多的数据就可以把分布图画出来,实际上现在我们来看老皮尔逊求出的分布就是样本分布,而费歇尔就说了,你样本量跟总体数量差那么多,你顶天了就是用样本分布来估计一下总体分布。这里费歇尔引出了总体分布与样本分布的不同,于是就有了第二讲中样本统计量对总体参数的估计。同时费歇尔还提出一个好的统计量要满足三个准则:一致性、无偏性、有效性。上一讲中计算样本方差时除以n-1的操作就是它变成了无偏的,而开根号以后变成了样本标准差就不再是无偏估计了。

总结比较样本均值的抽样分布形式(统计起源第五讲)(2)

总体与样本的关系,用样本统计量估计总体参数,这就是推论统计

“学生”戈赛特在《生物统计》期刊上发表的那篇题名《平均数的可能误差》(The Probable Error of the Mean)的文章,所提出的问题就是,样本的平均数跟总体的平均数究竟有多大的误差呢?为了探究这个问题,我们必须引入第三种分布,样本均值分布。样本均值分布既不是样本的分布也不是总体的分布,而是假设你不停的抽样本,每组样本的均值的分布。好,让我们说人话,为了简化问题,假设我们抓了4个外星人,然后我们教他们学英语,再带他们去考雅思,然后他们分别考了2,4,6,8分。这个时候4个外星人的雅思成绩就是要研究的总体(在特定的情况下总体包含的数量可能会很小,但是为了模拟真实的情况,我们还是抽取样本来研究),我们从这4个数组成的总体里有放回的抽取一个样本量n=2的样本,第一次,抽到了2和4,计算样本平均数为3;第二次,抽到了4和4(因为有放回,可能抽到同一个数),计算样本平均数是4,;第三次,抽到了2和6,计算样本平均数还是4;就这样一直抽,抽了16次以后,我们把这16组样本的均值画在图上,就得到了样本均值频数分布图。

总结比较样本均值的抽样分布形式(统计起源第五讲)(3)

左图是一个只有4个数的总体,右图是样本均值的频数分布图

在现实生活中,总体一般不会只有4个数,比如所有运动员的身高,所有减肥者的体脂率,所有科学家的发量……而且当我们抽取很多很多次以后,我们就能观察到样本均值分布变成正态分布了!这就是中心极限定理。

总结比较样本均值的抽样分布形式(统计起源第五讲)(4)

随着格子越来越多,就能逐渐看出,样本均值分布是满足正态分布的

样本均值服从的分布就叫样本均值分布,一般来说,这个分布是服从正态分布的。样本均值分布的均值等于总体的均值,样本均值分布的标准差被称为标准误,标准误等于总体的标准差除以根号n(n是样本量,这个例子里n=2)。因此,虽然样本均值分布是假想中不断抽取样本并求出一大堆均值得到的,但是实际上样本均值分布的形状只与总体有关。看着样本均值分布的图形,你就知道样本的均值跟总体的均值之间的误差有多少了,这个误差不是一个固定的数,而是一个概率分布,它的特点是,如果你只抽取一组样本,它的均值很可能跟总体均值很接近,但是也有很小的概率离总体均值很远。这就是戈赛特所提出的问题的答案。

总结比较样本均值的抽样分布形式(统计起源第五讲)(5)

在分布中面积的比就是概率,样本均值M在总体均值μ附近的概率最大,距离越远则概率越小

你能准确说出标准差和标准误的区别吗?欢迎评论区留言,这对后面的内容非常重要。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页