统计学敏感系数(赤裸裸的统计学-)
#程序员# #统计学# #机器学习#
最近一直在读《赤裸裸的统计学》这本书,作为一本统计学的入门读物,非常浅显易懂的让人明白统计学是什么,能用来解决哪些具体的现实问题,还举了大量的例子,提供了计算思路。
这里我把自己的读书笔记分享一下。
## 民意测验与误差幅度
民意测验是统计推断的另一种形式,就是基于从某个人口群体中所抽取的人口样本的观点所做出的推断。其基础就是“中心极限定理”。
误差和置信区间:如,民意测验结果有95%的概率在实际情况正负3%的范围内浮动。
标准误这个指标所要传达的就是:不同样本的平均值和不同民调结果的离散程度。
百分比的标准差的计算公式
- P: 某个特定观点的回应者比例
- 1-P: 不同观点的回应者比例
- n:样本中所有回应者的数量
- 当 p 与 (1-p) 的差距越来越大时,标准误会越来越小
假如500名选民里有53%投票给了共和党,那么其标准差:
解释是:我们有68.2%的把握说共和党的支持率是
要让可信度提升就必须扩大误差幅度。比如,我们知道,根据正态分布,我们有95.4%的把握预测值会落在2个标准差以内,就是
。另外,当样本数量增大时,标准差会减小。当选民增加到2000人,民主党得票率是52%时,其标准差就是
甚至我们还可以继续扩大我们的把握,就是我们有 99.7%的把握认为预测值在3个SE误差范围内,即
.
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com