数据不服从正态分布怎么做(跟我学用OFFICE24)

034 normdist

助记:英文的“normal distribution”

类别:统计

语法:

normdist(x,mean,standard_dev,cumulative)

参数:4个参数

  • x 要计算正态分布概率密度的数值
  • mean 正态分布的算术平均值
  • standard_dev 正态分布的标准偏差
  • cumulative 逻辑值。如果为false返回概率密度函数,如果为true累积分布函数。

说明:

  • 如果mean或standard_dev为非数值型,返回#VALUE!错误。
  • 如果standard_dev≤0,返回错误值#NUM!。
  • 概率密度函数计算公式为:

数据不服从正态分布怎么做(跟我学用OFFICE24)(1)

其中,期望值μ决定了位置,其标准差σ决定了幅度

  • 累积分布函数为从负无穷大到给定X处的积分。

用法:返回指定正态分布的概率密度函数。此函数在统计方面应用范围广泛(包括假设检验)。

下面我们学做正态分布曲线

1)新建一个工作表,在A~C列随机产生3组各500个身高数。A列使用“=randbetween(140,200)”并向下填充到A501,B列参数为(150,190) ,C列参数为(160,180)。

2)D列输入X的等差数列,从135~205,间隔为5。

3)E~G列计算概率密度,在E2中输入“=normdist(”,点击D2单元格,按F4变成“$D2”,再输入“,average(”,点击A列标签,继续输入“),stdav(”,点击A列标签,输入“),false)”。完成公式的输入。然后拖动D2单元格右下角拖动柄将公式复制到G16(先横后纵或先纵后横均可)。

数据不服从正态分布怎么做(跟我学用OFFICE24)(2)

4)选择E1:G16区域,点击“插入”标签,依次点击“折线图”、“二维折线图”。再次点击图表,在出来的“设计”标签中,点击“选择数据”,在“水平(分类)轴标签”下点击“编辑”,选择D2:D16区域,一路确定。

数据不服从正态分布怎么做(跟我学用OFFICE24)(3)

5)其实,计算概率密度函数只需要两个参数即可。日常生活中由于数据量有限,用算术平均值作为期望值的近似,用样本标准差作为总体标准差的近似。从图中可以看出围绕中国成年男性平均身高170cm我们生成了三列随机数据,其分布并不满足理想的正态分布,但并不影响理想正态分布函数的计算。从图中可以看出样本标准差对正态分布图形的影响,值越大,数据分布范围越大,即离散度较大,曲线越平滑。反之亦然。

6)你可以在生成一列以中国成年女性平均身高为期望值的随机数,会影响正态分布峰值的位置,即正态分布图形峰值的左右移动。

7)我们将第4个参数改为true,重新填充一下E~G列的公式。如图表示正态分布曲线从负无穷到给定x值下的图形面积,即x值前面所有值概率的总和。

数据不服从正态分布怎么做(跟我学用OFFICE24)(4)

8)将两张图同时放在一起,便类似于质量管理上著名的“帕累托图”。一般是按照发生频率大小顺序绘制的直方图。对于这种非连续的离散计数型变量,频数或者频率可以使用累加公式“=sum($E$2:$E2)”进行计算。

数据不服从正态分布怎么做(跟我学用OFFICE24)(5)

(待续)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页