统计学数据的整理与显示实践总结(白话统计阅读笔记)

什么是虚拟变量/哑变量虚拟变量实际上是一种将多分类变量转换为二分类变量的一种形式,Dummy这个词的意思是虚拟的、假的,所以也叫做哑变量、假的变量,所谓的虚拟变量就是把原先的一个多分类变量转换为多个二分类变量,如果多分类变量中有k个类别,则可以转换为k-1个二分类变量,如变量x为赋值1、2、3、4的四分类变量,那么就可以转换为3个赋值为0和1的二分类变量,而分类变量的结果需要结合参照来解释通过生成虚拟变量,就把原来的一个系数变成了多个系数,这多个系数更详细地展示了自变量和因变量之间的关系,尤其在自变量和因变量之间呈非线性关系时更为重要,我来为大家科普一下关于统计学数据的整理与显示实践总结?下面希望有你要的答案,我们一起来看看吧!

统计学数据的整理与显示实践总结(白话统计阅读笔记)

统计学数据的整理与显示实践总结

什么是虚拟变量/哑变量

虚拟变量实际上是一种将多分类变量转换为二分类变量的一种形式,Dummy这个词的意思是虚拟的、假的,所以也叫做哑变量、假的变量,所谓的虚拟变量就是把原先的一个多分类变量转换为多个二分类变量,如果多分类变量中有k个类别,则可以转换为k-1个二分类变量,如变量x为赋值1、2、3、4的四分类变量,那么就可以转换为3个赋值为0和1的二分类变量,而分类变量的结果需要结合参照来解释。通过生成虚拟变量,就把原来的一个系数变成了多个系数,这多个系数更详细地展示了自变量和因变量之间的关系,尤其在自变量和因变量之间呈非线性关系时更为重要。

Ref:《白话统计》 冯国双著

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页