如何用excel做一个正态分布图(Excel数据分析泊松分布)
想想明天要过国庆节了,好好的节假日怎么能不偷懒呢?所以,放水的内容得留着明天写,今天还是弄点正经的吧
泊松分布,在很多介绍的文章里都会把它和二项分布放在一起比较,因为它们有点像,对于这个观点,我是不会脑抽到为了标新立异而去刻意反对的
先放出Excel中的公式:
=POISSON(X,平均数,FALSE)
其中X的定义和二项分布中一样,是一件事情发生的次数,要求是个大于等于0的整数(你放个带小数点的数字进去它也不会报错,就是自动给你向下取整罢了),不同的地方是X的取值没有设上线(二项分布中要求X的大小需要小于总的实验次数N)
既然不能不提到二项分布,那干脆列出来再比较下:
=BINOMDIST(X,N,P, FALSE)
有没有发现参数的个数不一样?嗯,泊松分布要求的输入比二项分布少一点,但是就意义上来说差别却不是很大,为什么这么说呢?
泊松分布中的参数"平均值"一定程度上相当于二项分布的总实验次数N*先验概率P
咱还是举猜拳这个例子(没错,人家和硬币杠上,我是和猜拳杠上了)
二项分布中,比方咱们假设和一个不认识的家伙猜了30次拳(够无聊的啊),咱赢的先验概率是1/3,放到二项分布那就是=BINOMDIST(X,30,1/3, FALSE)
但要是放到泊松分布,它的理解方式大概是这样的,我们比方说是在10分钟里和对方猜完了30次拳,正常来说平均的赢面1/3也就是平均值30/3=赢10次,那么咱们在下个10分钟里和对方再猜30次拳,请估计下比较可能赢多少次呢?
公式就变成了这样:=POISSON(X,10,FALSE)
我们把X从0到31都代进去看看:
首先可以看到右下角二项分布的最后一个数,由于X=31超出了总次数30,所以直接报错,而泊松分布虽然没有次数限制,但是当X取值大于平均值很多很多的时候,它计算出的概率已然是0了,即使不报错,再计算下去也不会有意义
所谓字不如表,表不如图,咱看下用这些计算结果画出来的图:
虽然有点差距,但整个图形还是有点像的
根据有些介绍文章上的推论,当二项分布取的实验次数足够大的时候,和泊松分布近似相等,人家数学能力高端,可以像模像样用公式推导求极限什么的来证明,我就比较粗糙了,实践出真知,不就是把数值放大么,做一个呗
咱现在在这个例子上放大100倍,这样的话,公式就变成了:
二项分布=BINOMDIST(X,3000,1/3, FALSE)
泊松分布=POISSON(X,1000,FALSE)
结果就不列表了,直接上图:
(前后端的0值略有点多啊,我就截当中一段吧)
感觉曲线最高点的位置好像是近了一丢丢,但是高度上还是有点差别
听说先验概率P越小,这两货也会越接近,那我再捯饬下看看?
概率P缩小到1/10时
二项分布=BINOMDIST(X,3000,1/10, FALSE)
泊松分布=POISSON(X,300,FALSE)
嗯,感觉那些推导公式的家伙应该没有蒙人,看着是接近点了呢~~~~
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com