卡方检验能在什么情况下使用(卡方检验及其应该注意的事项)
卡方检验我们需要了解的以下几个方面:单个样本分布的拟合优度检验,独立样本的2*2列联表资料的卡方检验,独立样本R*C列联表资料的卡方检验,配对2*2列联表的卡方检验。
那么卡方检验是指一种连续型随机变量的概率分布,如果有许多个独立的标准正太分布随机变量,那么独立随机分布之和称为服从自由度为V的卡方分布,卡方分布的概率密度曲线的形状以来于自由度的大小。
基本思想:拟合优度检验是根据样本的频率分布检验其总体分布是否符合某给定理论分布,卡方值反映了样本实际频率分布于理论分布的符合程度。
拟合优度卡方检验应该注意的事项:
-
分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于5.
-
需要有足够的样本含量,如果样本含量不大,需要经连续性教正,我们也有相应的校正公式。
实际上是两独立样本率差异的比较,即根据两独立样本的频率分布,检验两个样本的总体分布是否相同。
那么一般可以直接应用卡方检验公式,也可以使用等价的专用公式或者校正公式。
在使用专用公式的时候:n不小于40,T(理论值)不小于5;
在当n>=40的时候,但是某个格子出现1<=T<5,此刻需要校正的公式;
当n<40或者T<1的时候,则需要用Fisher确切概率法检验。
目的:1.多个独立样本率的比较:根据R个独立样本的频率分布,检验R个二项分布总体的概率分布是否相同。
2.多个独立样本频率分布的比较:根据R个独立样本的频率分布,检验R个总体分布是否相同。
在检验的时候应该注意的事项:
-
对于多个率或者频率分布比较的卡方检验,结论为拒绝H0时,仅表示多组之间又差别,并不是任2组之间度有差别,若要明确那两组之间有差别,则还需要进一步作多组间的两两比较;
-
R*C列联表资料的卡方检验要求理论频数不宜太小,一般不宜有五分之一以上的格子的理论频数小于5,或有一个理论频数小于1.
-
卡方检验不适用于有序分类资料的比较。
配对2*2列联表资料卡方检验目的:通过配对设计的两样本资料来推断两方法的阳性概率有误差异。
对于R*C列联表资料的配对检验,则通过样本资料来推断两个变量的总体概率分布是否相同。
2*2列联表资料卡方检验的确切概率法当出现以下情况的时候,需要使用确切概率法以做判断:
-
样本含量小于40
-
理论频数小于1
-
卡方检验后所得概率P接近检验水准α
确切概率计算法的基本思想和步骤:
-
在四个表边缘合集固定不变的条件下,计算表内4个实际频数变动时的各种组合的概率P
-
按检验假设计算单侧或双侧的累计概率P
-
把P值与检验水准α比较,做出是否拒绝H0的结论.
卡方检验是一个非常常见的统计学方法,在率的比较中尤为常用,因此对于不同的应用场景,大家一定要注意.
图文无关,仅做配图
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com