excel指数曲线预测(Excel数据分析指数分布)

指数分布公式:=EXPONDIST(x,平均值,FALSE)

提到这个分布往往就必须联系泊松分布,这两者之间关系还挺大的

泊松分布公式:=POISSON(X,平均值,FALSE)

公式里的参数看起来是不是好像的说?但实际上,它们是有一点区别的

之前解释二项分布时,参数中的第一项X,通常都被解释成一件事情发生的次数,也就说它一般是个整数,而到了泊松分布时,虽然X的取值不再有总实验次数N的上限,但为了方便和二项分布比较,这里的X我依然还是解释成了事情发生的次数

但是就更一般的情况来说,其实它还可以解释为时间,为什么呢?因为时间这个概念,其实是个人为创造的刻度,你可以使用通常意义上的一分钟、一小时乃至一天作为时间的单位,但也可以用一件以固定频率不断重复发生的事情每出现一次(或一个周期)作为一个时间间隔,这样的话,泊松分布便成为了一种适用于推广到时间序列的计算方式

excel指数曲线预测(Excel数据分析指数分布)(1)

所以此处泊松分布里的参数"平均值",其实也可以解释为,在一个单位周期里,某件事情的平均发生次数

那指数分布和泊松分布有什么联系呢?首先就概念上来说,它们公式参数中的"平均值",指的其实是同一个意思,都是单位周期里事情的发生次数,而主要的区别,是参数X的取值

可以做个小小的实验,比如取同样的平均值5,并计算一系列的X,可以看到两种分布的计算结果:

excel指数曲线预测(Excel数据分析指数分布)(2)

表格有点长,可以直接看图:

excel指数曲线预测(Excel数据分析指数分布)(3)

是不是觉得泊松分布那条线有点奇怪?

细心点的亲有可能注意到了,泊松分布的计算结果只有整数的X值,当X取小数时自动向下取整,以致于这条线变成了一截一截的,但指数分布的X是不受带小数点的影响的,因为它的主要功能是计算距离事情下次发生的周期时长

套用之前看的网剧天才J中某集的概念(第一季,具体哪集忘记了),我个人是这么理解的,泊松分布表示是是一件事情的通用规律,是整个事情的整数部分,而指数分布则表示这件事情的偶然性,相当于这件事情的小数部分,但这两个公式的本质是一样的,而且它们的确都属于同一个族,这个族名叫伽马分布

对上面这个观点有疑惑的可以查下它们的数学公式形式,不过我本人作为应用型(俗称数学没学好),一向碰到数学推导就跳过,所以在这里仅用我自己的习惯来证明观点:

excel指数曲线预测(Excel数据分析指数分布)(4)

上面的数据用Excel算一下还是很容易验证的

最后提一个在很多讲指数分布的资料上都会重点强调的地方,这个分布有个重要的特征叫做无记忆性,关于这个特征的解释,我在某个论坛的帖子里看到了一个很牛的例子,自认不会比他解释的好,所以直接上图了:

excel指数曲线预测(Excel数据分析指数分布)(5)

这个例子很准确的说明了一个问题,那就是我们提到的从二项分布到泊松分布再到今天的指数分布,其实都是具备同一个条件,那就是独立随机,什么意思呢?就是说不管是扔硬币猜拳还是掷骰子,当整个环境规则(先验概率)确定后,事情的结果是不确定的,而且每一次事件的发生都与之前已经发生的事情没有联系,我们费那么多事算出来的东西,终究是对未知世界的一种猜测罢了

excel指数曲线预测(Excel数据分析指数分布)(6)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页