正态分布在生活中应用 正态分布在用户等级划分的应用

问题:根据用户播放时长,划分若干等级。目前可使用的数据为日人均播放时长。等级从低到高,要求达到的时间越来越久。

理论:日人均播放时长符合正态分布,这里省略验证过程,可通过绘制QQ图验证。正态分布图如下

正态分布在生活中应用 正态分布在用户等级划分的应用(1)

可知,3σ原则为

数值分布在(μ-σ,μ σ)中的概率为0.6827

数值分布在(μ-2σ,μ 2σ)中的概率为0.9545

数值分布在(μ-3σ,μ 3σ)中的概率为0.9973

即x≥μ-σ的发生概率约84%,x≥μ发生概率约50%,x≥μ σ发生概率约16%,x≥μ 2σ发生概率约为3%。

实践:

本例中要求划分为4个等级。

第一步,取某足够长时间的播放数据;

第二步,计算日人均播放时长(分);

第三步,计算日人均播放时长的平均值μ=62和标准方差σ=12.5

第四步,计算3σ分布

正态分布在生活中应用 正态分布在用户等级划分的应用(2)

第五步,得出各点的概率

正态分布在生活中应用 正态分布在用户等级划分的应用(3)

第六步

正态分布在生活中应用 正态分布在用户等级划分的应用(4)

解释:

理论上来讲

84%的人一周后获得第一个等级

50%的人一个月后获得第二个等级

16%的人6个月后获得第三等级

3%的人12个月后获得第四个等级

小结:

第一个等级 350分钟即5.8小时

第二个等级 1860分钟即31小时

第三个等级 13500分钟即9.4天

第四个等级 31755分钟即22天

展望:

由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。为了便于描述和应用,常将一般正态分布转化成标准正态分布。通过查标准正态分布表就可以直接计算出原正态分布的概率值。根据该理论可以实现任意等级的划分,只需将正态分布转为标准正态分布,根据每个等级可达到的概率进行查表活动相应的分界点。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页