缺失值处理方法
- 删除
- 如果每列或者行数据缺失值达到一定的比例,建议放弃整行或整列。
- 插补
- 可以通过缺失值每行或者列的平均值、中位数来填充。
sklearn缺失值API
- sklearn.preprocessing.Imputer
Imputer语法

Imputer流程
- 初始化Imputer,指定“缺失值”,指定填补策略,指定行或列 注:缺失值也可以是别的指定要替换的值
- 调用fit_transform
代码示例:
from sklearn.preprocessing import Imputer
import numpy as np
def im():
'''
缺失值处理
:return: None
'''
# NaN,nan
im = Imputer(missing_values='NaN',strategy='mean',axis=0)
data = im.fit_transform([[1,2],[np.nan,3],[7,6]])
print(data)
return None
if __name__ == '__main__':
im()
# 运行结果
[[1. 2.]
[4. 3.]
[7. 6.]]