没有经验的人可以做统计工作吗(不懂点统计学怎么行)

这年头,在公司里,不管你是做质量的,还是搞生产的,又或者是负责研发工作的,甚至是财务或者物流的,或多或少得遇上些(概率)统计学的知识。

然而,大多数朋友在大学一毕业后,就将(概率)统计学的知识,统一打包还给老师了!

今天,我们一起,看看 (概率)统计学在过程能力研究中的应用。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(1)

1.变差(Variation)

世界上没有完全相同的两片树叶。

同样,也没有完全相同的两个零件,哪怕是在同一生产过程之下。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(2)

零件之间的差异就是变差(Variation)

变差是有害的,至少在追求零件一致性的工业化生产中是这样的。

尽管如引,变差却与人的生老病死一般,是不可避免的

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(3)

当变差大到一定程度,大到人们无法容忍的地步,就会产生不合格品

这个对于某个特性能容忍的区间,就是所谓的公差/规格限

对于公差/规格限,很多朋友会有这样的一种思路,某一特性,在要求范围内的就是合格的,比如长度、宽度、重量等等。

这好比足球比赛,只要足球进了球门,不管是在中间进了,还是擦着门柱进去的,都算得分!

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(4)

当特性在要求的范围内,我们觉得客户是满意的。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(5)

确实,这样的思路有一定的道理,也很同意理解。

然而,随着时间的推移,一个新的变差理论慢慢崭露头角并慢慢被人们所接受。

它的核心理论是:不管技术规格大小,任何偏离目标值的产品都会带来损失

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(6)

新理论虽然也关注产品,但视野却慢慢扩大的制造产品的整个过程——即过程质量。

即尽量保证过程质量的稳定,减少制造出不合格品的“可能”

这些“可能”会产生产品检查、测试、返工的成本;顾客不满意度增加的成本,最终导致“损失”。

这些都是什么样的“可能”,如何进行评价,要回答这些问题你需要了解些(概率)统计学方面的知识。

2.两个非常重要的定理(律)

谈到(概率)统计学,不可避免得要去谈很多很多的数学公式,运算与推理。

这些正是很多朋友望而却步的,因为这些东西太抽象了。

抽象到“要不是要写这篇文章,我也不愿意去看它们,哪怕一眼”!

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(7)

既然这么抽象,我们就不妨异想天开一下,话说你穿越到17世纪的法国。

看到一大帮无聊透顶的贵族在皇宫玩掷硬币。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(8)

第一个人掷了10次,正面出现7次。于是他得出结论,任意掷一次硬币出现正面的概率是0.7。

第二个人掷了50次,正面出现30次。于是他得出结论,任意掷一次硬币出现正面的概率是0.6。

第三个人掷了100次,正面出现65次。于是他得出结论,任意掷一次硬币出现正面的概率是0.65。

第四个人掷了200次,正面出现110次。于是他得出结论,任意掷一次硬币出现正面的概率是0.55。

……

第一百个人掷了1000次,正面出现505次,于是他得出结论,任意掷一次硬币出现正面的概率是0.505。

这时候,在边上一直看着的你,终于忍耐不住,抬手推了一下隐形眼镜,大声地说:

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(9)

女士们,先生们,大家别再抛了,安静一下,现在我来宣布两个定理(律):

定理一:当我们把掷的次数扩大到无限时,会发现出现正面的概率会趋向于0.5,这就是大数定律

定理二:我们绘制一个直角坐标,X轴表示这一百回合我们每次掷的次数:即10,20,100,200……,1000。Y轴表示每一回合正面出现的概率:即0.7,0.6,0.65,0.55……0.505。把这些点全部连接起来,会发现它的形状非常像正态曲线,此乃中心极限定理

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(10)

为什么大花周章讲这两个定律?我们来看看。

大数定律的核心是当样本数量很大的时候,样本均值和真实均值充分接近

中心极限定理同样有着广泛的实际应用背景。

在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的

大数定律与中心极限定理一起,成为现代概率论、统计学、理论科学和社会科学的基石

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(11)

哇!可以这么牛?

(概率)统计学是与某些事发生的“可能性”打交道的,寻找这些可能性的规律并总结出来,来推测尚未发生事情发生的可能性大小。

大数定律与中心极限定理正是前人总结的关于可能性的规律。

这些规律在虽然都被后人用严格的数学证明过,但最开始的时候是人们通过经验或猜想所得。

尽管如此,这些经验或猜想还是推动概率论、统计学、理论科学和社会科学等学科的长足进步。

3.在过程能力研究中的应用

在中心极限定理里,我们提到了正态分布,那么什么叫正态分布呢?

正态分布也称“常态分布”,又名高斯分布,其曲线呈钟型,两头低,中间高。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(12)

在工业生产中,很多特性都符合正态分布,我们就以某产品尺寸举例。

上图的“μ”数学期望,你可以理解成目标值,比如尺寸为10mm;

“σ”标准差,是总体各单位标准值与其平均数离差平方的算术平均数的平方根(注意这里是总体),假设这里的σ为1mm;

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(13)

如果对于这个零件的公差要求为1mm,如下图(红线包在其中的部分),则该尺寸的合格率为34.1% 34.1%=68.2%

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(14)

类似的,如果公差为2mm,合格率为为95.4%

公差为3mm,合格率为99.7%(红线包在里面数字相加)。

上面的描述略显累赘,于是我们定义了过程能力指数Cp

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(15)

式中的USL与LSL分别代表公差的上下限(如11mm,9mm)。

然而,在实际中,我们遇到了两个困难。

a. 产品的平均值不一定恰好等于“μ”称数学期望

比如上面提到的产品尺寸要求为10±1mm(这是期望),但实际所有产品的平均值可能算出来有偏差,比如是13mm。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(16)

为了解决这个问题,我们在Cp后面跟了个小尾巴k,计算公式也调整为:

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(17)

X上面两横表示均值,min表示两个里面选小的。

b. 我不可能测量所有的产品

注意上面标识出来“σ”为标准差里讲的是“总体”,而实际操作过程中我只可能取一定数量的样本而不是整个生命周期所有产品去测量。

这就存在一个样本去推测总体的问题,其前提是过程稳定(这也是计算Cpk的一个大前提)。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(18)

什么样的过程才算稳定呢?其实关键是看有没有“特殊原因”。

那如果过程不稳定怎么办?就不能评价了吗?别急,我们还有其他指标。

4.Cpk、Ppk与Cmk

过程不稳定,表明过程中还有“特殊原因”的干扰,在一些产品还未正式进入批量时常会遇到(那会儿,屁股还没完全擦干净)。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(19)

完了!屁股没擦干净被发现了!

对于这种情况,我们又创造了过程性能指数Pp与Ppk。其公式分别如下:

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(20)

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(21)

注意公式中红框强调出来的“s”,叫样本标准差,这是与Cpk中σ(总体标准差)最大的区别。

对于此,可以理解成已经不强求一定要推测出总体的能力了(那是Cpk干的事),所以过程不一定需要稳定。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(22)

聊到现在都是讲过程,过程的影响因素有句很有名的口诀叫“人机料法环”。

在新的过程认可时,美国人更加关注初始过程能力(Ppk或Cpk)的研究,而德国人则更加关注“人机料法环”中设备,即机器能力(Cmk)的研究。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(23)

Cmk的计算公式与Ppk完全相同,从此我们也可以看出它同样不需要过程稳定。这三者的关系如下图所示。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(24)

Cpk:大批量生产的长期的过程能力控制(重点是组内差异),一般要求>1.33;

Ppk:小批量生产或订单量不大,可以不连续,(重点是组间差异)一般要求>1.67;

Cmk:新设备、检修后的设备或新产品试产,对设备能力的评估,至少50件样品,一般要求>2.0。

5.6σ(六西格玛)的误区

相信很多人都听说过6σ,可是你真的知道它的真正含义吗?

我们之前在算过σ、2σ、3σ的情况,这里不妨都罗列一下:

P[|X|<σ] = 68.26 % P[|X|<2σ] = 95.44 % P[|X|<3σ] = 99.73 % P[|X|<4σ] = 99.9936% P[|X|<5σ] = 99.999994 % P[|X|<6σ] 几乎等于1(次品率约十亿分之一)。

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(25)

相信有些朋友看到这里可能会想,嗯,这就对了,6σ就应该是这样,追求完美,几乎为1。

但实际上并不如此,十亿分之一的次品率没有企业可以达得到,我们还有个6σ有个3.4ppm的说法。

中间的推导过程这里就不展示(有近10页之多),我们需要了解的关键词就是“漂移”

没有经验的人可以做统计工作吗(不懂点统计学怎么行)(26)

据资料记载,有美国学者花了近30年时间研究发现,实际的生产流程中会是有数据的“漂移”现象的,经过计算,这种漂移是1.49个标准差(σ),四舍五入的话就是1.5σ。

“漂移” 的原因噪音因子。是长期生产过程中,质量数据的噪音因子是不可避免的,并且是上下波动的;通过大量数据演算,估算出在稳定情况下(仅存在噪音因子)长期质量能力相对短期而言的有一定的偏差,这就是“漂移”。

去除这个1.5σ的漂移,6σ就变成4.5σ了,有兴趣的朋友算算看是不是3.4ppm。

以上就是今天的全部内容,有点烧脑。

更多内容,欢迎关注卡尔先生~

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页