缺失值处理方法

  1. 删除
    • 如果每列或者行数据缺失值达到一定的比例,建议放弃整行或整列。
  2. 插补
    • 可以通过缺失值每行或者列的平均值、中位数来填充。

sklearn缺失值API

  • sklearn.preprocessing.Imputer

Imputer语法

Imputer流程

  1. 初始化Imputer,指定“缺失值”,指定填补策略,指定行或列 注:缺失值也可以是别的指定要替换的值
  2. 调用fit_transform

代码示例:

from sklearn.preprocessing import Imputer
import numpy as np
def im():
    '''
    缺失值处理
    :return: None
    '''
    # NaN,nan
    im = Imputer(missing_values='NaN',strategy='mean',axis=0)
    data = im.fit_transform([[1,2],[np.nan,3],[7,6]])
    print(data)
    return None
if __name__ == '__main__':
    im()
# 运行结果
[[1. 2.]
 [4. 3.]
 [7. 6.]]

发表回复