一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - python 缺失值處理的方法(Imputation)

python 缺失值處理的方法(Imputation)

2021-07-28 00:47飛飛飛鳥不會飛 Python

這篇文章主要介紹了python 缺失值處理的方法(Imputation),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

一、缺失值的處理方法

由于各種各樣的原因,真實世界中的許多數據集都包含缺失數據,這些數據經常被編碼成空格、nans或者是其他的占位符。但是這樣的數據集并不能被scikit - learn算法兼容,因為大多數的學習算法都會默認數組中的元素都是數值,因此素偶有的元素都有自己的代表意義。

使用不完整的數據集的一個基本策略就是舍棄掉整行或者整列包含缺失值的數值,但是這樣處理會浪費大量有價值的數據。下面是處理缺失值的常用方法:

1.忽略元組

當缺少類別標簽時通常這樣做(假定挖掘任務涉及分類時),除非元組有多個屬性缺失值,否則該方法不是很有效。當每個屬性缺少值的百分比變化很大時,它的性能特別差。

2.人工填寫缺失值

一般該方法很費時,并且當數據集很大,缺少很多值時,該方法可能行不通。

3.使用一個全局常量填充缺失值

將缺失的屬性值用同一個常數(如“Unknown”或 負無窮)替換。如果缺失值都用“unknown”替換,則挖掘程序可能會認為它們形成一個有趣的概念,因為它們都具有相同的值“unknown”。因此,雖然該方法很簡單,但是它十分不可靠。

4.使用與給定元組屬同一類的所有樣本的屬性均值

例如:將顧客按照credit_risk分類,則使用具有相同信用度的給定元組的顧客的平均收入替換income中的缺失值。

5.使用最可能的值填充缺失值

可以用回歸、使用貝葉斯形式化的基于推理的工具或決策樹歸納確定。例如,利用數據集中其他顧客的屬性,可以構造一顆決策樹來預測income的缺失值。

注意:缺失值并不總是意味著數據的錯誤!!!!!!!

二、缺失值處理的代碼實現

class:`Imputer`類提供了缺失數值處理的基本策略,比如使用缺失數值所在行或列的均值、中位數、眾數來替代缺失值。該類也兼容不同的缺失值編碼。

1、使用均值填充缺失值

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import numpy as np
 
from sklearn.preprocessing import Imputer
 
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
 
import numpy as np
 
from sklearn.preprocessing import Imputer
 
###1.使用均值填充缺失值
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit([[1, 2], [np.nan, 3], [7, 6]])
 
 
X = [[np.nan, 2], [6, np.nan], [7, 6]]
print(imp.transform(X))
[[4.     2.    ]
 [6.     3.66666667]
 [7.     6.    ]]

2、Imputer 類也支持稀疏矩陣:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import scipy.sparse as sp
 
X = sp.csc_matrix([[1, 2], [0, 3], [7, 6]])
 
imp = Imputer(missing_values=0, strategy='mean', axis=0)
 
imp.fit(X)
 
 
X_test = sp.csc_matrix([[0, 2], [6, 0], [7, 6]])
 
print(imp.transform(X_test))
 
#注意,在這里,缺失數據被編碼為0, 這種方式用在當缺失數據比觀察數據更多的情況時是非常合適的。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持服務器之家。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 失禁尿丝袜vk | 波多野结衣在线中文字幕 | kisssis无减删全集在线观看 | 五月色天在线视频综合观看 | 亚洲国产成人在线视频 | 女教师系列三上悠亚在线观看 | 色哟哟国产成人精品 | 日本指交 | 日韩视频一区二区 | www.色.con| 四虎院影永久在线观看 | 日本中文字幕在线视频 | 亚洲 欧美 中文字幕 在线 | 国产午夜精品久久理论片 | 国产综合视频在线 | 四虎最新紧急更新地址 | 成人网中文字幕色 | 免费国产成人 | heyzo1754北岛玲在线视频 | 2021国产精品露脸在线 | 国产卡一卡二卡3卡乱码免费 | 久久久精品免费视频 | 日本十大顶级绝伦推理片 | 77久久| 女人c交zzzooo在线观看 | 麻豆资源 | 免费看美女被靠到爽 | ange venus与黑人 | 91韩国女主播 | 亚洲2023无矿砖码砖区 | 羞羞视频污 | 午夜亚洲WWW湿好大 午夜想想爱 | 荡女淫春2未删减版 | 国产婷婷高清在线观看免费 | 日本xxxx69hd | 美女沟厕撒尿全过程高清图片 | 青青青国产精品国产精品美女 | 成人动漫在线免费看 | 亚洲欧美乱 | 亚洲欧美午夜 | 日本bbwbbw|