均值与标准差的关系是什么(你和平均水平平均)

这是《机器学习中的数学基础》系列的第20篇,也是概率与统计的第4篇。

一说起期望值,可能有的人会很陌生;但一说起平均数,可能大部分人都了解。其实求期望和求平均之间还是有那么一些关系的。

  • 期望

我们先来举个例子,让你对期望有直观的理解。

假设我有1个不均匀的六面体,每个面标了一个数字,分别是1、2、3、4、5、6。如果我将此六面体向上抛出,那么落地时向上一面的概率如下表所示:

均值与标准差的关系是什么(你和平均水平平均)(1)

显然,上述的概率之和为1。那么此六面体向上一面的期望是什么呢?

我们是这样计算期望的:把每个面出现的概率乘以每个面的数字,然后算它们的加和。即:

1·1/6 2·1/3 3·1/6 4·1/12 5·1/12 6·1/6=37/12

因此,上面这个六面体落地时正面朝上的期望就是37/12,换算成整数约等于3.

不均匀的算出来了,那如果是均匀的六面体呢?它落地时向上的一面的期望又是什么呢?

很简单,由于是均匀的六面体,那么每个面朝上的概率都是1/6。因此,总的期望就是1/6(1 2 3 4 5 6)=21/6=3.5。此时,就相当于我们求了1-6的平均数。

换句话说,如果每个数字出现的概率是相等的,那我们就相当于求的平均数;如果每个数字出现的概率是不等的,那我们就在求期望。我们一般用“E”来表示期望。

  • 方差

我们还是来举例说明什么是方差。

假设小明期末考试考了6门课,他的成绩分别是60,78,77,90,92,83。那么小明成绩的方差该怎么算呢?

我们需要先算出小明的平均成绩:(60 78 77 90 92 83)/6=80。

然后,分别用小明每一门课的成绩减去平均成绩,求出差的平方,再算出这些平方的平均值。即

[(60-80)^2 (78-80)^2 (77-80)^2 (90-80)^2 (92-80)^2 (83-80)^2]/6=111。

我们把这个结果就叫做方差。把它一般化, 假设有x1、x2...xn一共n个数据,它们的均值是μ,那么方差就可以表示为:

均值与标准差的关系是什么(你和平均水平平均)(2)

有时候分母的n也会换成n-1,取决于它是样本数据还是整体数据,不过对我们的结果影响不大。

那么方差有什么意义呢?它所表示的是数据的波动程度,更具体的说,它表示的是数据与均值之间的离散程度。方差越大,表明数据越分散,离均值的平均距离远;方差越小,表明数据大多集中在均值周围。

  • 标准差

标准差就是方差开方得到的结果,即

均值与标准差的关系是什么(你和平均水平平均)(3)

那这么做有什么意义呢?注意到,我们的方差是求了平方的,如果我们的数据是有单位的话,最后的结果将是单位的平方,对这个结果不是很好解释。比如上面小明成绩的方差是111,单位是“分”的平方。我们就会感到很奇怪。

将方差开方后,单位就变成了原来的单位,那么结果就很好解释了。可以得出,小明成绩的标准差约为10.5分。也就是说,小明的成绩与均值的差距平均在10.5分。

标准差同样衡量数据的波动状况,只不过它的结果很好解释。

好了,这就是今天的全部内容,欢迎留言讨论。

本文由人人都会机器学习原创,欢迎关注,带你一起长知识!

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页