3种重要的连续型随机变量分布(算法数学基础-最常见的连续型随机变量分布)

对于非离散型的随机变量X,由于其可能的取值不能一一列举出来,不能用分布律来描述。比如一只灯泡的寿命,我们只能给出一个范围比如大于10000小时,而不能说它正好是10000小时。所以任何连续型随机变量取单个值的概率都为零,所以只能用区间来描述随机变量的取值。

但其与离散型随机变量的本质相同,也是一个集合,只不过这个结果集合的元素是无穷多个,只能用区间来表示。如果X表示灯泡的寿命,5000<x<1000的概率就可以表示为P(5000<X<10000) = P(X<10000)-P(X>5000)。这个直观就能看出来,因为x<10000这个集合一定比x<5000集合包含的元素多,而且他们是包含关系,所以结果应该是多的集合减去少的集合,这样就可以理解了。如果表达成函数关系F(x) = P(X<x),那么上面这个例子就可以写成P(5000<X<10000)=F(10000)-F(5000)。这个F就是随机变量X的分布函数。是不是很好理解?当然分布函数有一系列行之,比如是单调增加的(不减),x趋向于正无穷的时候为1,负无穷的时候为0,0<=F(X)<=1,函数是右连续的(0点的值在函数的右侧)。

随机变量分布函数的概念了解以后,我们再来看另外一个重要的概念,就是随机变量的概率密度。密度是什么?一个物体的质量并不能反映它的本质,比如一公斤铁和一公斤棉花质量是相同的,但是密度不同,所以密度更能够反映一件事情的本质特征。所以,随机变量的概率密度更能反映随机现象的本质特点,因为有可能存在相同的随机变量函数表示有着不同的概率密度函数。这里有投过现象看本质的意思在里面。那为什么离散型的随机变量没有概率密度函数呢?因为离散型随机变量不连续,无法用微积分的方法来分析。所以离散型随机变量用分布律来表征,连续性随机变量用概率密度而不是概率分布来表征。数学公式不写了,大家可以去查,就是概率密度函数的不定上限积分等于分布函数(几何意义就是概率密度函数所围成的面积为分布函数的值)。

连续型随机变量分布有以下几种(大家注意连续型随机变量的分布是指概率密度函数的分布,不是概率分布):

1、均匀分布:概率密度函数为一平行于轴的直线。记作U(a,b)

2、指数分布:概率密度函数为一指数曲线;符合这个分布的随机事件有个有趣的现象,也称为无记忆性,比如假设灯泡的寿命满足指数分布,则灯泡使用500后,再使用100小时的概率与新灯泡可使用100小时的概率是一样的,也就是后面发生的事情与前面是否发生没有关系。

3、正态分布:概率密度函数为一高斯曲线,则称为满足正态分布或高斯分布。正态分布是最常见、最有用的一种随机变量分布,后面会大量接触到。图形的位置和形状由数据的均值和方差决定。将均值为0,方差为1的正态分布称为标准正态分布,值可以查表求得,一般来说正态分布都转化为标准正态分布来计算的。标准正态分布的值一般落在6个标准差范围内的概率为99.74%,所以质量管理中的6西格玛管理就是从这里来的,保证产品合格率落在6个标准差范围内的管理方法。在自然界中大量的现象都符合正态分布,如男性的身高、测量误差、海洋波浪的高度、半导体中的热噪声电流或电压等等。

这个专题的最后一个内容就是,随机变量的函数的分布。就已知X的分布,求2X的分布。因为实际中有些随机变量无法直接测得,但是可以通过可测函数推出来。比如我们无法直接测量圆面积,但是可以测量半径,通过半径来求出圆的面积。大家可以参看相关教材中的公式推导,用的时候直接查就可以了不复杂。但有个前提是符合函数严格单调的情况下成立。


3种重要的连续型随机变量分布(算法数学基础-最常见的连续型随机变量分布)(1)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页