统计工具和统计技术的区别(统计技术概述)
一、定义及内容
产品实现的各个阶段和质量管理体系的全过程普遍存在着变异情况,但客观存在的变异情况大多不是能直接观察到的,往往需要通过对能反映这些特性值的数据进行分析处理才能识别。
在企业质量管理中,统计技术所研究的对象主要是过程的变异。变异并非是杂乱无章的,反映变异的数据往往符合一定的统计分布规律,通过对数据的统计分析,能更好的了解变异的性质、程度、趋势和原因等。
应用有关统计方法,收集、整理、分析和解释统计数据,并对其反映的问题做出一定结论就是统计技术。
二、数据的分类
数据依特性大体可分为两大类:计量值数据和计数值数据。
计量值数据:是指可以连续取值的数据,在确定的区间可以无限取值,如长度、重量、强度、化学成分等。
计数值数据:是指只能间断取值的数据,如检验中的不合格品数,铸件中的瑕点数等可以用0、1、2……来表示的数据。
中位数
有时,为减少计算,将样本数据按大小排列,用位于正中的那个数或中间两个数的平均值(当数据为偶数个时)表示数据的总体平均水平。
中值M 测定值中的最大值与最小值的平均值。
众数
在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值也称众数。
2.数据的离散特征值
极差R
偏差平方和S
各测定值与平均值之差称为偏差。各测定值的偏差的平方和称为偏差平方和,用S表示。
无偏方差
各测定值的偏差平方和除以(n-1)后所得得值。
标准偏差s
无偏方差的平方根为标准偏差。
五、几种典型的统计分布
1)正态分布
正态分布是典型的连续概率分布。当随机变量由为数众多的的因素影响,而又没有一个因素起主导作用的情况下,该分布一般服从正态分布。如机械加工的尺寸、化工产品的化学成分、测量误差等。
正态分布的特点:
1.曲线最高点的横坐标,对应正态分布的总体平均值,用μ表示,这意味着随机变量X在μ附近出现的概率最大。
2.从理论上讲,曲线以μ为对称轴。
3.该曲线的函数表达式为
σ为总体标准差,常以样本标准差S代替
μ为总体平均值,常以样本平均值代替
4.由f(x)的函数表达式可以看出,任一正态分布仅由两个参数,即μ和σ 完全确定。 μ称分布的位置参数, σ称分布的形状参数; σ值越小,曲线越陡,数据离散越小; σ值越大,曲线越扁平,数据的离散也越大。
5.正态分布曲线下某区域的面积,表示总体数据落在该区域的概率。以下是质量管理中常用的几个结论:
总体数据落在:
μ ±1σ界限范围内的概率为68.26%
μ ±1.96σ界限范围内的概率为95.0%
μ ±2σ界限范围内的概率为95.46%
μ ±3σ界限范围内的概率为99.73%
μ ±4σ界限范围内的概率为99.9937%
μ ±5σ界限范围内的概率为99.999943%
μ ±6σ界限范围内的概率为99.99999982%
当公差中心与正态分布中心偏差±1.5σ时, 6σ控制限表示不合格品率为3.4PPM的质量水平。
标准正态分布
为便于应用,可令μ=0, σ=1的正态分布为标准正态分布,记为N(0,1)。根据式(1),标准正态分布函数可记为:
对于μ≠0, σ ≠ 1的任一正态分布,只需作如下变换,即设Z=(X-μ)/ σ
X<Z的标准正态分布N(0,1)的累积分布函数:
2)二项式分布
研究的对象:事物只有两种结果或状态,如一件产品的检验,要么合格,要么不合格。
如果用p和q分别表示不合格品率和合格品率,则n个产品中出现x个不合格品的概率为:
二项式分布的均值和标准差为:
在抽样检验中,常设一个合格判定数C,此时需要计算当X=0,1,2,……,C的接受概率,即计算X≤C的累积概率:
3)泊松分布
泊松分布主要描述稀有事件的分布,如纺织品中的瑕点,铸件中的气孔,溶液中的杂质等。泊松分布有时也叫瑕点分布或计点分布。
瑕点数为x的概率为:
泊松分布的累积概率为:
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com