0.引言
利用python開發(fā),借助Dlib庫進(jìn)行人臉識(shí)別,然后將檢測到的人臉剪切下來,依次排序顯示在新的圖像上;
實(shí)現(xiàn)的效果如下圖所示,將圖1原圖中的6張人臉檢測出來,然后剪切下來,在圖像窗口中依次輸出顯示人臉;
實(shí)現(xiàn)比較簡單,代碼量也比較少,適合入門或者興趣學(xué)習(xí)。
圖1 原圖和處理后得到的圖像窗口
1.開發(fā)環(huán)境
python: 3.6.3
dlib: 19.7
OpenCv, numpy
import dlib # 人臉識(shí)別的庫dlib import numpy as np # 數(shù)據(jù)處理的庫numpy import cv2 # 圖像處理的庫OpenCv
2.設(shè)計(jì)流程
工作內(nèi)容主要以下兩大塊:dlib人臉檢測 和 繪制新圖像
2.1 dlib人臉檢測:
dlib的使用,在我之前另一篇博客里面介紹過;
2.2 繪制新圖像:
2.2.1 確定空白圖像尺寸
這部分首先要根據(jù)檢測到的人臉數(shù)和人臉大小,來確定繪制圖像所需要的尺寸:
多張人臉要輸出到一行,先進(jìn)行一次人臉的遍歷,記每張人臉的尺寸為height*width(高度和寬度說明見圖2),
我取的生成圖像的尺寸:height_max(最大高度)和width_sum(寬度之和),然后根據(jù)尺寸大小來新建空白圖像:
img_blank = np.zeros((height_max, width_sum, 3), np.uint8)
2.2.2 圖像填充
然后再進(jìn)行一次人臉遍歷,這次進(jìn)行空白圖像img_blank進(jìn)行填充:
for i in range(height): for j in range(width): img_blank[i][blank_start+j] = img[d.top()+i][d.left()+j]
圖2 圖像尺寸說明
如果想訪問圖像的某點(diǎn)像素,可以利用img[height][width]:
存儲(chǔ)像素其實(shí)是一個(gè)三維數(shù)組,先高度height,然后寬度width;
返回的是一個(gè)顏色數(shù)組(0-255,0-255,0-255),按照(B, G, R)的順序,比如 藍(lán)色 就是(255,0,0),紅色 是(0,0,255);
3.源碼
- # 2018-01-22
- # By TimeStamp
- # #cnblogs: http://www.cnblogs.com/AdaminXie/
- import dlib # 人臉識(shí)別的庫dlib
- import numpy as np # 數(shù)據(jù)處理的庫numpy
- import cv2 # 圖像處理的庫OpenCv
- # dlib預(yù)測器
- detector = dlib.get_frontal_face_detector()
- predictor = dlib.shape_predictor('shape_predictor_68_face_landmarks.dat')
- # 讀取圖像
- path = "F:/code/python/***/pic/"
- img = cv2.imread(path+"test.jpg")
- #print("img/shape:", img.shape)
- # dlib檢測
- dets = detector(img, 1)
- print("人臉數(shù):", len(dets))
- # 記錄人臉矩陣大小
- height_max = 0
- width_sum = 0
- # 計(jì)算要生成的圖像img_blank大小
- for k, d in enumerate(dets):
- # 計(jì)算矩形大小
- # (x,y), (寬度width, 高度height)
- pos_start = tuple([d.left(), d.top()])
- pos_end = tuple([d.right(), d.bottom()])
- # 計(jì)算矩形框大小
- height = d.bottom()-d.top()
- width = d.right()-d.left()
- # 處理寬度
- width_sum += width
- # 處理高度
- if height > height_max:
- height_max = height
- else:
- height_max = height_max
- # 繪制用來顯示人臉的圖像的大小
- print("img_blank的大小:")
- print("高度", height_max, "寬度", width_sum)
- # 生成用來顯示的圖像
- img_blank = np.zeros((height_max, width_sum, 3), np.uint8)
- # 記錄每次開始寫入人臉像素的寬度位置
- blank_start = 0
- # 將人臉填充到img_blank
- for k, d in enumerate(dets):
- height = d.bottom()-d.top()
- width = d.right()-d.left()
- # 填充
- for i in range(height):
- for j in range(width):
- img_blank[i][blank_start+j] = img[d.top()+i][d.left()+j]
- # 調(diào)整圖像
- blank_start += width
- cv2.namedWindow("img_faces", 2)
- cv2.imshow("img_faces", img_blank)
- cv2.waitKey(0)
結(jié)果:
圖3 原圖和處理后得到的圖像窗口
以上就是本次我們介紹的關(guān)于Python3結(jié)合Dlib實(shí)現(xiàn)人臉識(shí)別和剪切的相關(guān)技術(shù)內(nèi)容,大家如果在學(xué)習(xí)后還有任何不明白的地方可以在下方的留言區(qū)討論。
原文鏈接:https://www.cnblogs.com/AdaminXie/p/8339863.html