数据挖掘顺序分析的理解(数据描述性统计之集中趋势-均值)
均值 (代数度量) (样本 vs. 总体)(mean):
Note: n 样本大小, N 总体大小.
- 加权算术均值:
- 截断均值: 去掉高低极端值
中位数(median):
- 奇数则为有序集的中间值, 否则为中间两个数的平均
§ 众数Mode
- 出现频率最高的值(不唯一/每个值出现一次则没有)
- 1/2/3个众数-〉单峰的, 双峰的, 三峰的
- 经验公式(Empirical formula):mean-mode=3*(mean-median)
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com