数据挖掘顺序分析的理解(数据描述性统计之集中趋势-均值)

均值 (代数度量) (样本 vs. 总体)(mean):

Note: n 样本大小, N 总体大小.

- 加权算术均值:

- 截断均值: 去掉高低极端值

数据挖掘顺序分析的理解(数据描述性统计之集中趋势-均值)(1)

中位数(median):

- 奇数则为有序集的中间值, 否则为中间两个数的平均

数据挖掘顺序分析的理解(数据描述性统计之集中趋势-均值)(2)

§ 众数Mode

- 出现频率最高的值(不唯一/每个值出现一次则没有)

- 1/2/3个众数-〉单峰的, 双峰的, 三峰的

- 经验公式(Empirical formula):mean-mode=3*(mean-median)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页