自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

深度學(xué)習(xí)中圖片數(shù)據(jù)庫(kù)的網(wǎng)絡(luò)爬取與數(shù)據(jù)清洗

原創(chuàng)
新聞
隨著大量的訓(xùn)練數(shù)據(jù)以及深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)的推動(dòng),人臉識(shí)別或者是其他物體識(shí)別幾乎比得上人的肉眼識(shí)別。利用一些獨(dú)有的大規(guī)模訓(xùn)練數(shù)據(jù)集,一些研究團(tuán)體在LFW或其他人臉數(shù)據(jù)集上取得了相當(dāng)好的表現(xiàn),達(dá)到了97%-99%的準(zhǔn)確率。越來(lái)越多開(kāi)源的卷積神經(jīng)網(wǎng)絡(luò)框架已經(jīng)不斷涌現(xiàn)出來(lái),也有相應(yīng)的很多人臉數(shù)據(jù)庫(kù),包含了大量的人臉圖片數(shù)據(jù)。

51CTO學(xué)院IT課程1折起秒殺,12月12日0點(diǎn)萬(wàn)人秒殺準(zhǔn)時(shí)開(kāi)啟,我是51CTO學(xué)院深度學(xué)習(xí)課程講師浦深,跟大家分享一些個(gè)人經(jīng)驗(yàn)。

在當(dāng)前深度學(xué)習(xí)之下,隨著大量的訓(xùn)練數(shù)據(jù)以及深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)的推動(dòng),人臉識(shí)別或者是其他物體識(shí)別幾乎比得上人的肉眼識(shí)別。利用一些獨(dú)有的大規(guī)模訓(xùn)練數(shù)據(jù)集,一些研究團(tuán)體在LFW或其他人臉數(shù)據(jù)集上取得了相當(dāng)好的表現(xiàn),達(dá)到了97%-99%的準(zhǔn)確率。越來(lái)越多開(kāi)源的卷積神經(jīng)網(wǎng)絡(luò)框架已經(jīng)不斷涌現(xiàn)出來(lái),比如 Caffe、Theano、TensorFlow等,也有相應(yīng)的很多人臉數(shù)據(jù)庫(kù),比如WebFace、FDDB、YouTubeFace、MultiPIE等等,包含了大量的人臉圖片數(shù)據(jù),情況看起來(lái)似乎很良好,卷積神經(jīng)網(wǎng)絡(luò)框架有了,大規(guī)模數(shù)據(jù)也有了,加上各種物體檢測(cè)算法Rcnn、FastRcnn、FasterRcnn、Ssd等,仿佛可以不費(fèi)吹灰之力訓(xùn)練得到一個(gè)表現(xiàn)良好的模型,然而,事實(shí)并非如此,請(qǐng)看下圖:

我們從某個(gè)數(shù)據(jù)庫(kù)下載下來(lái)的,一個(gè)名為jack的個(gè)人圖片數(shù)據(jù),可以看到,很多都不是同一個(gè)人的,當(dāng)然,最重要的是這樣混亂的個(gè)人圖片文件夾還不在少數(shù)!這樣的訓(xùn)練集是很難訓(xùn)練出另一個(gè)好的模型的。所以,當(dāng)下的情況是:深度學(xué)習(xí)工程應(yīng)用領(lǐng)域,數(shù)據(jù)比算法更重要!!!

上圖所舉的例子是圖片質(zhì)量比較差的情況,我們來(lái)看一個(gè)比較好的情況:

盡管說(shuō)情況比較良好,但仍然夾雜著一些非本人的圖片數(shù)據(jù)。

往下,我們來(lái)看看圖片數(shù)據(jù)庫(kù)是如何產(chǎn)生的,以及如何處理大規(guī)模圖片數(shù)據(jù)集中的噪聲,比如:在一個(gè)***別的數(shù)據(jù)集中去掉像***張圖那樣混亂的個(gè)人數(shù)據(jù)文件夾、去除質(zhì)量相對(duì)較好的個(gè)人圖片數(shù)據(jù)中非本人的圖片數(shù)據(jù)。

圖片數(shù)據(jù)庫(kù)的產(chǎn)生(以人臉數(shù)據(jù)為例)

人臉識(shí)別數(shù)據(jù)集只需要兩種數(shù)據(jù):人臉圖片和身份標(biāo)簽,隨機(jī)地從網(wǎng)絡(luò)上抓取圖片并且標(biāo)注它們,是一個(gè)幾乎不可能的任務(wù)。我們這邊介紹一個(gè)結(jié)構(gòu)非常良好的網(wǎng)站IMDb,這個(gè)網(wǎng)站包含了人物的信息,包括名字、年齡、性別、生日以及個(gè)人照片。我們來(lái)看下:

可以直接搜索人物名字,比如我們搜索Ben Foster ,結(jié)果如下所示:

結(jié)果中包含該人物的多種信息:人名、生日、個(gè)人圖片等等。你可以根據(jù)人名搜索每個(gè)人的數(shù)據(jù),每個(gè)人物在網(wǎng)站上都有一個(gè)獨(dú)立的頁(yè)面,我們通過(guò)一個(gè)人臉檢測(cè)器,可以自己訓(xùn)練一個(gè)淺層全卷積神經(jīng)網(wǎng)絡(luò)來(lái)處理,這個(gè)淺層網(wǎng)絡(luò)的設(shè)計(jì)非常重要,因?yàn)樵谶@個(gè)環(huán)節(jié)中,我們對(duì)圖片處理的速度要求是比較高的,具體的網(wǎng)絡(luò)設(shè)計(jì)及訓(xùn)練可以參考我的視頻教程(http://edu.51cto.com/course/course_id-7650.html)通過(guò)這個(gè)人臉檢測(cè)器,把所有圖片中包含人臉的圖片收集到本地?cái)?shù)據(jù)庫(kù)中。

這個(gè)階段的數(shù)據(jù)還不能夠用來(lái)訓(xùn)練,我們需要標(biāo)注每張人臉圖片所屬的人名。我們可以看到,有寫(xiě)圖片當(dāng)中包含的不僅僅一張人臉,也包含了不同人物的人臉,我們的任務(wù)是對(duì)每一張人臉進(jìn)行標(biāo)注并且要把這些非本人的人臉劃分到他們各自的文件夾里頭。這個(gè)該如何處理?看如下這張圖:

每張圖片底下都包含著每個(gè)人物的名字,我們可以根據(jù)這個(gè)標(biāo)簽來(lái)進(jìn)行處理,因?yàn)檫@個(gè)環(huán)節(jié)是對(duì)人名進(jìn)行搜索,而每個(gè)人物的名字均來(lái)自于影片中的名字,極有可能出現(xiàn)同名不同人的情況,這也是造成我們獲取到的人臉數(shù)據(jù)庫(kù)質(zhì)量不好的主要原因!

好了,問(wèn)題出現(xiàn)總是需要解決的,我們要處理的問(wèn)題有兩個(gè):1.去掉混亂程度較高的人物及其數(shù)據(jù);2.去掉圖片質(zhì)量相對(duì)較好的圖片中非人臉數(shù)據(jù)以及非本人的人臉數(shù)據(jù)。

我們可以這樣來(lái)處理:在訓(xùn)練好的經(jīng)典的分類(lèi)網(wǎng)絡(luò),比如VGG,GOOGLENET等上進(jìn)行微調(diào)訓(xùn)練,這個(gè)環(huán)節(jié)中重點(diǎn)是訓(xùn)練數(shù)據(jù),數(shù)據(jù)來(lái)源可以選擇一些質(zhì)量較好的人臉數(shù)據(jù)庫(kù),加上適當(dāng)?shù)娜斯ずY選效果更佳!那這個(gè)訓(xùn)練的網(wǎng)絡(luò)作用是什么?是用來(lái)提取每張圖片的特征,對(duì)吧!每張圖片用一行向量去表示。那一張圖片該用多少維度的向量去表示?這邊的維度指的是:比如pic1=[1,2,3,4],指的是4個(gè)維度,即用4個(gè)數(shù)據(jù)來(lái)表示一張圖片,然而實(shí)際的工程應(yīng)用當(dāng)中,向量的維度應(yīng)該取多少合適?假設(shè)我們已經(jīng)取得一個(gè)合適的維度,也對(duì)應(yīng)修改好了相應(yīng)的訓(xùn)練網(wǎng)絡(luò),并且提取好了每張圖片的向量,對(duì)于***個(gè)要處理的問(wèn)題(去掉圖片質(zhì)量相對(duì)較好的圖片中非人臉數(shù)據(jù)以及非本人的人臉數(shù)據(jù)),因?yàn)閳D片的質(zhì)量較好,可以取這個(gè)人的所有圖片的向量的平均值來(lái)代表這個(gè)人物的特征,然后這個(gè)人的所有圖片的特征值跟其對(duì)應(yīng)的平均值求距離,設(shè)置一個(gè)閾值,把跟平均特征值距離遠(yuǎn)的圖片過(guò)濾掉即可!

然而對(duì)于第二個(gè)問(wèn)題(去掉混亂程度較高的人物及其數(shù)據(jù)),由于圖片混亂程度相對(duì)較高,此時(shí)的平均特征值已經(jīng)無(wú)法代表這個(gè)人了,此時(shí),用解決上一個(gè)問(wèn)題的方法已經(jīng)不奏效了!!!該如何處理?

關(guān)于***種問(wèn)題的處理方法在我的深度學(xué)習(xí)視頻課程里頭已經(jīng)做了相應(yīng)的講解與示例,包括特征的提取等基本操作均已詳細(xì)進(jìn)行了說(shuō)明。關(guān)于第二個(gè)問(wèn)題的解決方案及其相應(yīng)的算法編寫(xiě)、工程經(jīng)驗(yàn)等都將會(huì)陸續(xù)在課程中進(jìn)行補(bǔ)充!

我的課程是用Windows的版本進(jìn)行演示,其實(shí),不管是在Linux下或者Windows下,僅僅編譯的時(shí)候有些區(qū)別,而對(duì)于caffe的使用基本上是一致的,請(qǐng)大家放心,Windows下用VS2013的開(kāi)發(fā)環(huán)境會(huì)更友好一些,比如在課程中我也將會(huì)帶大家一起修改caffe的源碼來(lái)滿(mǎn)足lmdb的多標(biāo)簽輸入的要求,在Windows下顯得更方便,當(dāng)然也可在Windows下更改后,再把工程拷貝到Linux下進(jìn)行編譯。

歡迎大家報(bào)名學(xué)習(xí)我的視頻課程:http://edu.51cto.com/course/course_id-7650.html

 

責(zé)任編輯:龐桂玉 來(lái)源: 51CTO.com
相關(guān)推薦

2017-04-06 22:19:15

2009-06-30 09:16:45

數(shù)據(jù)庫(kù)存儲(chǔ)JSP文件

2016-04-12 17:12:29

機(jī)器學(xué)習(xí)數(shù)據(jù)清洗美團(tuán)

2013-03-20 16:23:53

數(shù)據(jù)清洗

2019-04-04 09:00:00

網(wǎng)絡(luò)爬取庫(kù)與工具

2011-07-21 17:29:42

iPhone Sqlite 數(shù)據(jù)庫(kù)

2011-08-10 15:46:29

數(shù)據(jù)庫(kù)

2009-05-08 09:17:48

動(dòng)態(tài)數(shù)據(jù)庫(kù)圖片

2011-08-11 17:00:33

iPhone數(shù)據(jù)庫(kù)SQLite

2011-05-13 13:38:49

數(shù)據(jù)庫(kù)對(duì)象

2017-07-25 15:21:42

數(shù)據(jù)挖掘深度學(xué)習(xí)模型

2010-08-18 13:49:01

DB2數(shù)據(jù)庫(kù)

2009-07-31 13:52:26

ASP.NET數(shù)據(jù)庫(kù)圖

2011-08-23 15:16:54

OracleMySQL

2009-07-16 09:48:29

數(shù)據(jù)庫(kù)連接

2010-05-21 10:01:11

MySQL數(shù)據(jù)庫(kù)

2017-05-02 11:47:17

深度學(xué)習(xí)AI

2011-07-01 10:03:52

QT 數(shù)據(jù)庫(kù)

2011-08-30 12:59:52

Qt數(shù)據(jù)庫(kù)

2011-08-29 14:44:56

DBLINK
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)