博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习day02
阅读量:3933 次
发布时间:2019-05-23

本文共 393 字,大约阅读时间需要 1 分钟。

数据特征预处理

对数据进行处理,缺失值

  • 不同的类型数据的处理方式也不同
    • 数值型数据
      • 标准缩放:1.归一化 2.标准化 3.缺失值
    • 类别型数据:one-hot编码
    • 时间类型:时间的切分
数值型数据

1. 归一化

归一化的目的是使得某一个特征对最终结果不会造成更大的影响
归一化公式计算过程
代入公式
在sklearn中归一化步骤:
1. 实例化MinMaxScalar
2. 通过fit_transform转换
2. 标准化
通过对原始数据进行变换吧数据变换到均值为0,方差为1范围内
在这里插入图片描述

为什么还需要标准化

对于归一化来说,如果出现异常点,影响了最大值和最小值,那么结果显然会发生改变

对于标准化来说,如果出现异常点,由于有一定的数据量少量的异常点对于均值的影响并不大,从而方差改变较小。
在这里插入图片描述在这里插入图片描述

注:在已有的样本足够多的情况下比较稳定,适合现代嘈杂大数据场景

3. 缺失值处理

一般都在pandas中处理缺失值,这里简单介绍
在这里插入图片描述在这里插入图片描述

转载地址:http://ozhgn.baihongyu.com/

你可能感兴趣的文章
MySQL server has gone away 问题的解决方法
查看>>
常用链接
查看>>
Easyui Pagenation应用方法
查看>>
MySQL十大优化技巧
查看>>
MySQL数据库管理常用命令
查看>>
php 文件操作
查看>>
10个免费的PHP脚本资源下载网站推荐
查看>>
php正则表达式
查看>>
php自定义常量 define()函数
查看>>
PHP中文件读写操作
查看>>
PHP操作FTP-用法
查看>>
PHP面向对象v1:
查看>>
迭代开发优点
查看>>
php开发常识b_01
查看>>
php基础算法
查看>>
PHP PDO 学习笔记
查看>>
PDO存取资料库
查看>>
PDO常见用法
查看>>
curl用法
查看>>
csv文件读写操作
查看>>