数据分析优化算法(数据标准化算法介绍)

数据标准化是将操作字段按照给定的方法完成由原始数据到新数据的映射,以此消除多字段组合分析情况下存在的数量级和量纲的不同造成的不利影响,算法支持最大最小归一化、最大值归一化及Z标准化等方法。

算法思想

数据标准化是数据建模中数据预处理步骤,在某些比较和评价的指标处理中经常会用到去除数据单位限制,将其转化为无量纲的纯数值,便于不同单位或量级指标能够比较和加权,算法支持最大最小归一化、最大值归一化及Z标准化等方法。

具体介绍如下1、最大最小归一化

最大最小归一化是将数据转化到给定的[Min,Max]范围之内。公式如下

数据分析优化算法(数据标准化算法介绍)(1)

其中Xmin为x特征的最小值,Xmax为x特征的最大值.

2、最大归一化

最大归一化是将数据转化到[-1,1]范围之间。公式如下

数据分析优化算法(数据标准化算法介绍)(2)

其中|X|max为x特征的绝对值的最大值。

3、z标准化

z标准化也叫标准差标准化,经过处理的数据符合标准正态分布,即均值为0,标准差为1.

数据分析优化算法(数据标准化算法介绍)(3)

其中Mean(x)为x特征的均值,Std(x)为x特征的标准差。

数据格式:数值型字段;

参数说明

数据分析优化算法(数据标准化算法介绍)(4)

数据分析优化算法(数据标准化算法介绍)(5)

结果说明

数据分析优化算法(数据标准化算法介绍)(6)

对指定的属性进行标准化处理

Tempo数据建模工具演示实例:

利用数据建模工具构建如下流程:

数据分析优化算法(数据标准化算法介绍)(7)

【文件输入】节点配置如下:

数据分析优化算法(数据标准化算法介绍)(8)

【数据标准化】节点配置如下:

数据分析优化算法(数据标准化算法介绍)(9)

流程运行结果如下:

数据分析优化算法(数据标准化算法介绍)(10)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页