一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python sklearn中的.fit與.predict的用法說明

Python sklearn中的.fit與.predict的用法說明

2020-06-29 10:03冽夫 Python

這篇文章主要介紹了Python sklearn中的.fit與.predict的用法說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

我就廢話不多說了,大家還是直接看代碼吧~

?
1
2
3
4
5
6
7
8
9
clf=KMeans(n_clusters=5) #創建分類器對象
fit_clf=clf.fit(X) #用訓練器數據擬合分類器模型
clf.predict(X) #也可以給新數據數據對其預測
 
print(clf.cluster_centers_) #輸出5個類的聚類中心
 
y_pred = clf.fit_predict(X) #用訓練器數據X擬合分類器模型并對訓練器數據X進行預測
 
print(y_pred) #輸出預測結果

補充知識:sklearn中調用某個機器學習模型model.predict(x)和model.predict_proba(x)的區別

model.predict_proba(x)不同于model.predict(),它返回的預測值為獲得所有結果的概率。(有多少個分類結果,每行就有多少個概率,對每個結果都有一個概率值,如0、1兩分類就有兩個概率)

我們直接上代碼,通過具體例子來進一步講解:

python3 代碼實現:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
# -*- coding: utf-8 -*-
"""
Created on Sat Jul 27 21:25:39 2019
 
@author: ZQQ
"""
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
import numpy as np
import warnings
warnings.filterwarnings("ignore")
# 這個方法只是解決了表面,沒有根治
 
# 數據(特征,屬性)
x_train = np.array([[1,2,3],
          [1,5,4],
          [2,2,2],
          [4,5,6],
          [3,5,4],
          [1,7,2]])
# 數據的標簽
y_train = np.array([1, 0, 1, 1, 0, 0])
 
# 測試數據
x_test = np.array([[2,1,2],
          [3,2,6],
          [2,6,4]])
 
# 導入模型
model = LogisticRegression()
 
#model = RandomForestClassifier()
 
#model=XGBClassifier()
 
model.fit(x_train, y_train)
 
# 返回預測標簽
print(model.predict(x_test))
 
print('---------------------------------------')
 
# 返回預測屬于某標簽的概率
print(model.predict_proba(x_test))

運行結果:

Python sklearn中的.fit與.predict的用法說明

分析結果:

使用model.predict() :

預測[2,1,2]為1類

預測[3,2,6]為1類

預測[2,6,4]為0類

使用model.predict_proba() :

預測[2,1,2]的標簽是0的概率為0.19442289,1的概率為0.80557711

預測[3,2,6]的標簽是0的概率為0.04163615,1的概率為0.95836385

預測[2,6,4]的標簽是0的概率為0.83059324,1的概率為0.16940676

預測為0類的概率值和預測為1的概率值和為1

同理,如果標簽繼續增加,3類:0,1, 2

預測為0類的概率值:a

預測為1類的概率值:b

預測為2類的概率值:c

預測出來的概率值的和a+b+c=1

注:model.predict_proba()返回所有標簽值可能性概率值,這些值是如何排序的呢?

返回模型中每個類的樣本概率,其中類按類self.classes_進行排序。

通過numpy.unique(label)方法,對label中的所有標簽值進行從小到大的去重排序。

得到一個從小到大唯一值的排序。這也就對應于model.predict_proba()的行返回結果。

以上這篇Python sklearn中的.fit與.predict的用法說明就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持服務器之家。

原文鏈接:https://blog.csdn.net/helloworld0906/article/details/103214002

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: hd最新国产人妖ts视频 | 嫩草影院永久在线一二三四 | 1314酒色| 国产卡一卡二卡三乱码手机 | 精品国产综合区久久久久久 | 国产91第一页 | 天天舔天天射 | 3p文两男一女办公室高h | 惊弦45集免费看 | 国产成人精品免费午夜 | yellow片在线观看 | 男人天堂中文字幕 | 第一次做m被调教经历 | 91进入蜜桃臀在线播放 | 国产午夜精品久久理论片小说 | 久久中文骚妇内射 | 色悠久久久久综合欧美99 | 亚洲99久久无色码中文字幕 | 好硬好大好浪夹得好紧h | 久久国产精品无码视欧美 | 99re这里只有精品视频 | 国内自拍成人网在线视频 | 草草视频免费在线观看 | 91传媒在线观看 | 久久伊人精品青青草原2021 | 大ji吧快给我别停受不了视频 | 欧美亚洲影院 | 亚洲AV无码偷拍在线观看 | 亚洲第一网色综合久久 | 免费高清视频日本 | 精灵之森高清在线 | 三级黄色片在线观看 | 国产乱子伦一区二区三区 | 海角社区在线登录 | 国产高清在线精品一区二区 | 国产精品亚洲专区在线播放 | sihu国产午夜精品一区二区三区 | 好大好硬快点好爽公 | 摄像头东北对白清晰 | 91九色丨porny丨制服 | 日本无遮挡吸乳视频看看 |