数据预处理
iMing leeにより
1. 归一化
1.1. (0,1)之间的小数
1.2. 有量纲表达式变成无量纲表达式
1.3. 归一化的表达式
1.3.1. 线性
1.3.1.1. x' = (x - X_min) / (X_max - X_min)
1.3.1.2. 平均归一化
1.3.1.2.1. x' = (x - μ) / (MaxValue - MinValue)
1.3.2. 非线性
1.3.2.1. 对数函数转换:y = log10(x)
1.3.2.2. 反余切函数转换:y = atan(x) * 2 / π
1.3.2.3. 数据很大的,用log、指数,正切等
1.4. 使用场景
1.4.1. 对输出结果范围有要求
1.4.2. 数据较为稳定,不存在极端的最大最小值
2. 中心化
2.1. 均值为0
2.2. 标准差无要求
2.3. 使用场景
2.3.1. 数据存在异常值和较多噪音
3. 标准化
3.1. 均值为0
3.2. 标准差为1
3.3. 使用场景
3.3.1. 数据存在异常值和较多噪音