本文共 393 字,大约阅读时间需要 1 分钟。
对数据进行处理,缺失值
1. 归一化
归一化的目的是使得某一个特征对最终结果不会造成更大的影响 在sklearn中归一化步骤: 1. 实例化MinMaxScalar 2. 通过fit_transform转换 2. 标准化 通过对原始数据进行变换吧数据变换到均值为0,方差为1范围内对于归一化来说,如果出现异常点,影响了最大值和最小值,那么结果显然会发生改变
对于标准化来说,如果出现异常点,由于有一定的数据量,少量的异常点对于均值的影响并不大,从而方差改变较小。3. 缺失值处理
一般都在pandas中处理缺失值,这里简单介绍转载地址:http://ozhgn.baihongyu.com/