可怕,40行代碼的人臉識別實踐
最近聽說有這么一個黑科技,讓之前闖紅燈有恃無恐的人們紛紛給交警部門打電話,求交警叔叔能不能把自己的照片撤下來......
闖紅燈這件事情,一直是交通問題的一大頭疼病。自從交通法對機動車闖紅燈進行扣 6 分的舉措后,很多司機朋友們紛紛表示不敢怠慢了。
機動車好了,可是非機動車和行人闖紅燈的病咋治?當中國式過馬路已經(jīng)深入人心的時候,這不,黑科技來了,乍一看還真的很像警方在搜捕嫌疑人。
近期山東、江蘇、深圳等一些城市開始在交通路口上啟用了人臉識別系統(tǒng),針對行人和非機動車闖紅燈等違規(guī)行為進行抓拍,并現(xiàn)場進行曝光。
而對于行人和非機動車闖紅燈的行為,交管部門將會給予 20 元到 50 元的罰款。
雖然罰款錢數(shù)不多,但是最讓大家忌憚的就是,你不文明行為的視頻和你的個人信息,都會在大屏幕上全天輪次播放。交警叔叔說了,被拍的市民紛紛表示下次再也不敢闖紅燈了。
人臉抓拍系統(tǒng)的工作原理是:當紅燈亮起后,如有行人和非機動車越過停止線,系統(tǒng)會自動抓拍四張照片,保留 15 秒視頻并截取違法者頭像,即便在晚上也能清晰成像。除了現(xiàn)場回放,交管部門還將連接的戶籍信息進行曝光。
人臉識別技術(shù)到底是怎樣實現(xiàn)的呢?
很多人都認為人臉識別是一項非常難以實現(xiàn)的工作,看到名字就害怕,然后心懷忐忑到網(wǎng)上一搜,看到網(wǎng)上 N 頁的教程立馬就放棄了。
這些人里包括曾經(jīng)的我自己。其實如果如果你不是非要深究其中的原理,只是要實現(xiàn)這一工作的話,人臉識別也沒那么難。
今天我們就來看看如何在 40 行代碼以內(nèi)簡單地實現(xiàn)人臉識別。
一點區(qū)分
對于大部分人來說,區(qū)分人臉檢測和人臉識別完全不是問題。但是網(wǎng)上有很多教程有意無意地把人臉檢測說成是人臉識別,誤導群眾,造成一些人認為二者是相同的。
其實,人臉檢測解決的問題是確定一張圖上有木有人臉,而人臉識別解決的問題是這個臉是誰的??梢哉f人臉檢測是是人識別的前期工作。
今天我們要做的是人臉識別。
所用工具
Anaconda 2 —— Python 2
Dlib
scikit-image
Dlib
對于今天要用到的主要工具,還是有必要多說幾句的。Dlib 是基于現(xiàn)代 C++ 的一個跨平臺通用的框架,作者非常勤奮,一直在保持更新。
Dlib 內(nèi)容涵蓋機器學習、圖像處理、數(shù)值算法、數(shù)據(jù)壓縮等等,涉獵甚廣。更重要的是,Dlib 的文檔非常完善,例子非常豐富。就像很多庫一樣,Dlib 也提供了 Python 的接口,安裝非常簡單,用 pip 只需要一句即可:
- pip install dlib
上面需要用到的 scikit-image 同樣只是需要這么一句:
- pip install scikit-image
注:如果用 pip install dlib 安裝失敗的話,那安裝起來就比較麻煩了。錯誤提示很詳細,按照錯誤提示一步步走就行了。
人臉識別
之所以用 Dlib 來實現(xiàn)人臉識別,是因為它已經(jīng)替我們做好了絕大部分的工作,我們只需要去調(diào)用就行了。Dlib 里面有人臉檢測器,有訓練好的人臉關(guān)鍵點檢測器,也有訓練好的人臉識別模型。
今天我們主要目的是實現(xiàn),而不是深究原理。例子既然代碼不超過 40 行,其實是沒啥難度的。
首先先通過文件樹看一下今天需要用到的代碼:
準備了六個候選人的圖片放在 candidate-faces 文件夾中,然后需要識別的人臉圖片 test.jpg 。我們的工作就是要檢測到 test.jpg 中的人臉,然后判斷她到底是候選人中的誰。
另外的 girl-face-rec.py 是我們的 python 腳本。
shape_predictor_68_face_landmarks.dat 是已經(jīng)訓練好的人臉關(guān)鍵點檢測器。
dlib_face_recognition_resnet_model_v1.dat 是訓練好的 ResNet 人臉識別模型。
ResNet 是何凱明在微軟的時候提出的深度殘差網(wǎng)絡,獲得了 ImageNet 2015 冠軍,通過讓網(wǎng)絡對殘差進行學習,在深度和精度上做到了比 CNN 更加強大。
前期準備
shape_predictor_68_face_landmarks.dat和 dlib_face_recognition_resnet_model_v1.dat 都可以在這里找到。
不能點擊超鏈接的可以直接輸入以下網(wǎng)址:http://dlib.net/files/。
然后準備幾個人的人臉圖片作為候選人臉,***是正臉。放到 candidate-faces 文件夾中。
本文這里準備的是六張圖片,如下:
她們分別是:
然后準備四張需要識別的人臉圖像,其實一張就夠了,這里只是要看看不同的情況:
可以看到前兩張和候選文件中的本人看起來還是差別不小的,第三張是候選人中的原圖,第四張圖片微微側(cè)臉,而且右側(cè)有陰影。
識別流程
數(shù)據(jù)準備完畢,接下來就是代碼了。識別的大致流程是這樣的:
先對候選人進行人臉檢測、關(guān)鍵點提取、描述子生成后,把候選人描述子保存起來。
然后對測試人臉進行人臉檢測、關(guān)鍵點提取、描述子生成。
***求測試圖像人臉描述子和候選人臉描述子之間的歐氏距離,距離最小者判定為同一個人。
代碼
代碼不做過多解釋,因為已經(jīng)注釋的非常完善了。以下是 girl-face-rec.py:
- # -*- coding: UTF-8 -*-
- import sys,os,dlib,glob,numpy
- from skimage import io
- if len(sys.argv) != 5:
- print "請檢查參數(shù)是否正確"
- exit()
- # 1.人臉關(guān)鍵點檢測器
- predictor_path = sys.argv[1]
- # 2.人臉識別模型
- face_rec_model_path = sys.argv[2]
- # 3.候選人臉文件夾
- faces_folder_path = sys.argv[3]
- # 4.需識別的人臉
- img_path = sys.argv[4]
- # 1.加載正臉檢測器
- detector = dlib.get_frontal_face_detector()
- # 2.加載人臉關(guān)鍵點檢測器
- sp = dlib.shape_predictor(predictor_path)
- # 3. 加載人臉識別模型
- facerec = dlib.face_recognition_model_v1(face_rec_model_path)
- # win = dlib.image_window()
- # 候選人臉描述子list
- descriptors = []
- # 對文件夾下的每一個人臉進行:
- # 1.人臉檢測
- # 2.關(guān)鍵點檢測
- # 3.描述子提取
- for f in glob.glob(os.path.join(faces_folder_path, "*.jpg")):
- print("Processing file: {}".format(f))
- img = io.imread(f)
- #win.clear_overlay()
- #win.set_image(img)
- # 1.人臉檢測
- dets = detector(img, 1)
- print("Number of faces detected: {}".format(len(dets)))
- for k, d in enumerate(dets):
- # 2.關(guān)鍵點檢測
- shape = sp(img, d)
- # 畫出人臉區(qū)域和和關(guān)鍵點
- # win.clear_overlay()
- # win.add_overlay(d)
- # win.add_overlay(shape)
- # 3.描述子提取,128D向量
- face_descriptor = facerec.compute_face_descriptor(img, shape)
- # 轉(zhuǎn)換為numpy array
- v = numpy.array(face_descriptor)
- descriptors.append(v)
- # 對需識別人臉進行同樣處理
- # 提取描述子,不再注釋
- img = io.imread(img_path)
- dets = detector(img, 1)
- dist = []
- for k, d in enumerate(dets):
- shape = sp(img, d)
- face_descriptor = facerec.compute_face_descriptor(img, shape)
- d_test = numpy.array(face_descriptor)
- # 計算歐式距離
- for i in descriptors:
- dist_ = numpy.linalg.norm(i-d_test)
- dist.append(dist_)
- # 候選人名單
- candidate = ['Unknown1','Unknown2','Shishi','Unknown4','Bingbing','Feifei']
- # 候選人和距離組成一個dict
- c_d = dict(zip(candidate,dist))
- cd_sorted = sorted(c_d.iteritems(), key=lambda d:d[1])
- print "\n The person is: ",cd_sorted[0][0]
- dlib.hit_enter_to_continue()
運行結(jié)果
我們在 .py 所在的文件夾下打開命令行。運行如下命令:
python girl-face-rec.py 1.dat 2.dat ./candidate-faecs test1.jpg
由于 shape_predictor_68_face_landmarks.dat 和 dlib_face_recognition_resnet_model_v1.dat 名字實在太長,所以我把它們重命名為 1.dat 和 2.dat 。
運行結(jié)果如下:
- The person is Bingbing。
記憶力不好的同學可以翻上去看看 test1.jpg 是誰的圖片。有興趣的話可以把四張測試圖片都運行下試試。
這里需要說明的是,前三張圖輸出結(jié)果都是非常理想的。但是第四張測試圖片的輸出結(jié)果是候選人 4。對比一下兩張圖片可以很容易發(fā)現(xiàn)混淆的原因。
機器畢竟不是人,機器的智能還需要人來提升。
有興趣的朋友可以繼續(xù)深入研究如何提升識別的準確率。比如每個人的候選圖片用多張,然后對比和每個人距離的平均值之類的,全憑自己了。
