互助问答201期完整版 互助问答第7期
问:想请问下,数据的控制变量不显著的话,用什么办法能调整呢?自变量因变量显著,R方很低,0.1,我用的是混合OLS,应该是面板数据,是不同公司在不同年份的业绩表现的数据。使用的公式是reg robust,用XTSET YEAR 显示数据是非平衡面板,也用不了豪斯曼检验。
答:模型中控制变量如果比较多,可能是因为共线性,其中包括控制变量与控制变量之间的共线性、控制变量与自变量之间的相关性。建模者需要选用逐步回归筛选一下。不显著是因为t值较小,即t=b/s,s标准差较大,OLS估计的性质中的有效性差,即方差大,标准误差大。当然,原因不仅仅局限于共线性,自相关与异方差的存在都会使有效性得不到满足(方差不是最小的)。因此,只要克服了经典OLS回归中的基本假设不满足状况,就可以提高控制变量显著性。具体可使用广义差分法、广义最小二乘法(GLS)等方法来克服相关性;使用加强最小二乘法(WLS)、GLS等方法来克服异方差;使用逐步回归来克服共线性。
问:(1)李春涛老师带领的爬虫俱乐部编写了chinagcode命令,可以根据中文地址得到经纬度,这一经纬度返回的是百度坐标系(BD-09)下得到的经纬度,想请问一下这一经纬度如何在stata中转变为世界标准经纬度坐标系(WGS-84)下的经纬度?备注:我在网上找到了Python、R或者ArcGIS对应的code或package可以完成坐标转换,但是因为不想跨平台分析数据,所以想请问可否在stata中直接完成转换。
问:回归结果中系数的显著性主要是是根据z统计量或t统计量来判断得。每个系数服从不同的正态分布,不便比较,所以都转换为标准正态分布再检验,此时是z统计量判断。如果是小样本,再转换为t分布,根据t统计量判断。数据的分布是基于正态分布假设的。在不满足的正态分布的情况还有截断正态分布等。
学术指导:张晓峒老师
本期解答人:谢杰老师
编辑:李宁宁
统筹:易仰楠 李丹丹
技术:知我者 赵雅轩 郭凯
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com