统计相关系数题(白话统计阅读笔记)
用于无序分类资料的相关系数包括如下:∅系数、Cramer V系数、Pearson列联系数是基于卡方统计量而计算的;λ系数是基于类别判断错误而计算的;Q系数是基于一致和不一致的对子数而计算的,下面我们就来说一说关于统计相关系数题?我们一起去了解并探讨一下这个问题吧!
统计相关系数题
用于无序分类资料的相关系数包括如下:∅系数、Cramer V系数、Pearson列联系数是基于卡方统计量而计算的;λ系数是基于类别判断错误而计算的;Q系数是基于一致和不一致的对子数而计算的。
∅系数
首先需要了解一个规律,如果列联表中各个格子的比例保持不变,则卡方值与例数N是呈正比的,也就是说如果格子中的数据呈比例扩大后的卡方值也呈比例扩大,所以∅系数是基于这一思想提出来的,当两个变量毫无关系时,∅系数为0,当两个变量存在完全关系时,∅系数为1。
Cramer V系数
当行和列数大于2时,∅系数的取值可能大于1,这对于相关的描述是无法接受的,所以Cramer V系数用来描述在行和列大于2的列联表中两个变量的相关关系。
Pearson列联系数
该系数的也是为了避免∅系数最大取值大于1这种情形而产生的,它采用了另一种变换方式,保证了∅系数不超过1。
λ系数
其思路为假定有AXB的一张列联表,其中A作为分组变量(自变量),B作为结局变量(因变量),比如,如果吸烟与心肌梗死完全独立,那么根据一个人吸烟与否是无法判断去是否患有心肌梗死的,但如果吸烟与心肌梗死不是独立的,而是有关联的,如吸烟发生心肌梗死的概率更高,那么当已知一个人患有心肌梗死时,我们可能会倾向于判断他吸烟。λ系数反映了判断误差减少的比例,如果A和B无关,那么根据A来判断B就会有很大误差,因为你根本不知道该如何判断,而如果A和B有关,那么根据A来判断B的误差就会较小,也就是说A和B的 相关性越强,根据A来判断B的误差就越小,此时λ系数也就越大。
Q系数
当四格表中任意一个格子中的频数为0时,Q系数为1或-1,这一点与∅系数不同,在这种情况下,使用Q系数要谨慎,因为只有一个格子的频数为0并不意味着完全正相关或完全负相关。
Q系数只能用于四格表,不能用于行或列大于2的列联表。
Ref: 《白话统计》 冯国双著
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com