動(dòng)物面部識(shí)別技術(shù)用來做什么?
能夠準(zhǔn)確識(shí)別動(dòng)物的技術(shù)可以幫助主人與走失的動(dòng)物團(tuán)聚,幫助農(nóng)民監(jiān)控牲畜,幫助研究人員研究野生動(dòng)物。以往在這方面,微芯片是最受歡迎的動(dòng)物識(shí)別方法。然而,植入芯片需要進(jìn)行侵入性手術(shù)。如果沒有專門的設(shè)備,它們就無法讀取,而且小偷可以提取微芯片。另一種方法是DNA分析,它是精確的,但也非常昂貴和耗時(shí)。
由計(jì)算機(jī)視覺解決方案支持的動(dòng)物面部識(shí)別(有時(shí)不僅僅限于面部)可以作為上述方法的一個(gè)可行的替代方案。盡管它有其缺點(diǎn),但該技術(shù)可以在特定情況下顯示出高水平的準(zhǔn)確性。那么,動(dòng)物面部識(shí)別是如何操作的呢?阻礙這項(xiàng)技術(shù)進(jìn)步的挑戰(zhàn)會(huì)在哪里?
動(dòng)物面部識(shí)別是如何工作的
一般情況下,動(dòng)物面部識(shí)別解決方案主要有三個(gè)步驟:
圖像捕捉:用高分辨率相機(jī)拍攝動(dòng)物的照片。有些算法只對(duì)預(yù)定義的姿態(tài)起作用,所以必須選擇符合這些條件的圖像。
特征提取:評(píng)估動(dòng)物的生物特征數(shù)據(jù)的適用性,并在需要時(shí)進(jìn)行預(yù)處理。然后該算法提取出識(shí)別所需的特征集。
匹配:將提取的特征進(jìn)行數(shù)學(xué)表示,并與其他圖像進(jìn)行匹配。例如,如果我們正在丟失的寵物數(shù)據(jù)庫(kù)中尋找一只狗,我們將狗的獨(dú)特特征與該數(shù)據(jù)庫(kù)中所有的動(dòng)物進(jìn)行匹配。
幾種方法可以執(zhí)行匹配。一種方法是使用KNN和DBSCAN等算法進(jìn)行聚類,得到一組與我們的目標(biāo)圖像高度接近的圖像,用戶可以手動(dòng)選擇最合適的圖像。此外,還可以采用概率方法,將最終結(jié)果表示為置信水平。
尋找丟失的寵物
失去寵物對(duì)主人來說是令人心碎的。而且根據(jù)統(tǒng)計(jì)數(shù)據(jù),這種情況比人們想象的要普遍得多。在美國(guó),三分之一的家庭養(yǎng)的狗和貓?jiān)谝簧械哪硞€(gè)時(shí)刻失蹤,其中80%從未被找回來。有幾種基于寵物面部識(shí)別的工具可以幫助主人找到他們丟失的朋友。
ForPaws:這種動(dòng)物面部識(shí)別解決方案根據(jù)它們的鼻尖、皮膚顏色和皮毛類型來識(shí)別狗。動(dòng)物主人被要求上傳至少三張照片來創(chuàng)建動(dòng)物的“個(gè)人檔案“。目前,該方案可識(shí)別130個(gè)犬種,準(zhǔn)確率達(dá)90%。
PiP:這家動(dòng)物識(shí)別公司開發(fā)了一款應(yīng)用程序,允許動(dòng)物主人注冊(cè)并上傳他們動(dòng)物的照片。系統(tǒng)分析他們獨(dú)特的面部特征。PiP聲稱,如果主人能提供更多的信息,比如性別、大小和體重,它就能認(rèn)出每一只走失的貓和狗。
任何撿到走失寵物的人也可以使用該應(yīng)用程序?qū)ふ抑魅恕iP的解決方案還會(huì)不斷掃描社交媒體上的寵物帖子,并向相關(guān)社區(qū)的居民發(fā)送寵物失蹤警報(bào)。
Love Lost:Petco的Love Lost是另一款幫助寵物主人和寵物收容所的應(yīng)用程序。主人們被建議創(chuàng)建他們寵物的檔案,這樣當(dāng)寵物失蹤時(shí),軟件就可以開始將動(dòng)物的生物特征信息與收容所的新成員和其他候選寵物進(jìn)行匹配。
識(shí)別特定的動(dòng)物
有時(shí),訓(xùn)練一個(gè)算法來識(shí)別特定的動(dòng)物是有意義的。例如,動(dòng)物主人可以從一個(gè)系統(tǒng)中受益,該系統(tǒng)可以準(zhǔn)確識(shí)別他們的動(dòng)物,并執(zhí)行相應(yīng)的操作,例如發(fā)送警報(bào)或打開門讓動(dòng)物進(jìn)來。WeTransfer公司的前端工程師Arkaitz Garro開發(fā)了一種動(dòng)物面部識(shí)別解決方案,可以識(shí)別鄰居的貓,并在貓出現(xiàn)在門口時(shí)向Garro發(fā)送警報(bào)。
為了捕捉這只貓的照片,Garro使用了一個(gè)小型相機(jī)和一個(gè)帶有運(yùn)動(dòng)檢測(cè)軟件的樹莓派。當(dāng)一只動(dòng)物接近相機(jī)時(shí),系統(tǒng)會(huì)拍下一張照片,并將其發(fā)送到AWS識(shí)別平臺(tái),與Garro上傳的這只貓的其他照片進(jìn)行比較。如果匹配,工程師將收到通知。
微軟也開發(fā)了可以進(jìn)行動(dòng)物識(shí)別的物聯(lián)網(wǎng)(IOT)設(shè)備,可以連接到寵物入口。一旦識(shí)別出這是你自己的寵物,該設(shè)備就會(huì)打開門,讓它進(jìn)去。
協(xié)助科學(xué)研究——海豚的面部識(shí)別
人臉識(shí)別算法除了可以識(shí)別家庭動(dòng)物,還可以用于識(shí)別其他物種?!逗Q蟛溉閯?dòng)物科學(xué)雜志》上發(fā)表了一項(xiàng)研究,研究了識(shí)別海豚所需的一組特征。研究人員在12年的時(shí)間里跟蹤和拍攝了150只寬吻海豚。研究小組想要評(píng)估在海豚的一生中使用海豚的臉和背鰭來進(jìn)行識(shí)別的想法。
在150個(gè)實(shí)驗(yàn)對(duì)象中,只有31只海豚擁有完整的側(cè)臉(也就是臉部左右兩側(cè)和背鰭的清晰照片)。這項(xiàng)研究依靠人類專家意見和統(tǒng)計(jì)方法來檢測(cè)同一只海豚的不同圖像之間的相似性。
實(shí)驗(yàn)結(jié)果表明,海豚的面部特征隨著時(shí)間的推移保持一致,可以用于識(shí)別目的。甚至可以在幼崽成年后依然能夠識(shí)別它,這大大促進(jìn)了對(duì)海豚的研究。
幫助農(nóng)民監(jiān)測(cè)牲畜
識(shí)別農(nóng)場(chǎng)動(dòng)物是一個(gè)具有挑戰(zhàn)性的過程。拿豬來說,難度更大,因?yàn)樗械呢i看起來都一樣。但奶牛有點(diǎn)特殊,它們是黑白相間的,形狀也不一樣。然而,當(dāng)涉及到奶牛時(shí),另一個(gè)挑戰(zhàn)就出現(xiàn)了——在哪里安裝攝像頭。牛是一種好奇的動(dòng)物,會(huì)注意到周圍環(huán)境中哪怕是最微小的變化。它們經(jīng)常試圖舔相機(jī)或用其他方式與相機(jī)互動(dòng)。
但是建立一個(gè)能夠識(shí)別單個(gè)奶牛的系統(tǒng)將會(huì)極大地幫助農(nóng)民。這種解決方案可以將動(dòng)物的健康狀況和飲食模式與動(dòng)物的身份相匹配。通過人工智能的增強(qiáng),它將能夠檢測(cè)任何疾病跡象和異常行為,并在緊急情況下通知農(nóng)民。
北京翔創(chuàng)科技核心算法平臺(tái)已實(shí)現(xiàn)對(duì)豬、牛、羊、驢等牲畜的數(shù)據(jù)采集、面部識(shí)別,積累了千萬以上的牲畜面部數(shù)據(jù)。不僅幫助農(nóng)民進(jìn)行精細(xì)化養(yǎng)殖管理,還可以協(xié)助銀行、保險(xiǎn)等金融機(jī)構(gòu)針對(duì)養(yǎng)殖業(yè)開展業(yè)務(wù)時(shí)建立風(fēng)險(xiǎn)評(píng)估和預(yù)警系統(tǒng)。
實(shí)施動(dòng)物面部識(shí)別技術(shù)的挑戰(zhàn)
動(dòng)物的面部識(shí)別技術(shù)遠(yuǎn)遠(yuǎn)落后于目前相當(dāng)先進(jìn)的人臉識(shí)別技術(shù)。研究人員大約四年前開始對(duì)動(dòng)物面部識(shí)別進(jìn)行實(shí)驗(yàn),但通用技術(shù)的準(zhǔn)確性仍然相當(dāng)?shù)?。另一方面,具有特定目的的解決方案,例如識(shí)別一種特定的動(dòng)物,可以是準(zhǔn)確的。
想要實(shí)現(xiàn)動(dòng)物面部識(shí)別解決方案的公司需要考慮三個(gè)主要挑戰(zhàn):
確定最優(yōu)特征集
科學(xué)家們已經(jīng)指定了一種特征向量,可以用于獨(dú)特的人臉識(shí)別。然而,同樣的方法并不適用于動(dòng)物,因?yàn)槲覀儾恢牢覀冃枰褂媚男┕δ芤约叭绾谓忉屗鼈?。例如,在與人打交道時(shí),科學(xué)家可以使用變分自動(dòng)編碼器(VAE)架構(gòu)從人臉中提取特征。在這種方法中,一個(gè)人的照片被壓縮到包含所需特征的向量,如膚色和面部表情。
說到動(dòng)物面部識(shí)別,目前還沒有可靠的特征向量。解決一個(gè)可靠的特征向量的挑戰(zhàn)將大大推進(jìn)該領(lǐng)域的研究。
在這方面的一個(gè)開源例子是DogFaceNet,它是一個(gè)基于深度學(xué)習(xí)的狗識(shí)別實(shí)現(xiàn)。它使用狗的眼睛和鼻子作為特征集。如果整體目標(biāo)是區(qū)分狗的品種,這個(gè)解決方案工作得相當(dāng)好,但當(dāng)涉及到區(qū)分動(dòng)物個(gè)體時(shí),它的表現(xiàn)相當(dāng)差。
取決于一個(gè)動(dòng)物的姿勢(shì)
另一個(gè)例子是使用局部二值模式直方圖(LBPH)算法,它將圖像轉(zhuǎn)換成像素,通過比較不同圖像的像素值進(jìn)行運(yùn)算。這種方法取決于動(dòng)物的姿態(tài),這使得它對(duì)姿態(tài)變化很敏感。
對(duì)于人類來說,很容易擺出一個(gè)特定的姿勢(shì)并坐著不動(dòng)。然而,當(dāng)我們?cè)噲D讓貓或狗以特定的姿勢(shì)保持不動(dòng)時(shí),事情就變得更加復(fù)雜了。
提供全面的訓(xùn)練數(shù)據(jù)集
為了使訓(xùn)練有效,數(shù)據(jù)必須是多樣化的,并覆蓋算法預(yù)期執(zhí)行的所有任務(wù)。例如,如果該算法應(yīng)該識(shí)別不同的狗品種,那么數(shù)據(jù)集應(yīng)該充分覆蓋從不同角度捕獲的所有的品種,并進(jìn)行適當(dāng)?shù)臉?biāo)記。這里有幾個(gè)可能出錯(cuò)的地方。例如,有人可能會(huì)提交混合品種的圖片,有人可能會(huì)給他們的圖片貼上錯(cuò)誤的標(biāo)簽,并指定錯(cuò)誤的品種名稱。為了避免此類問題,專家必須逐一審查數(shù)據(jù)集中的所有照片,以驗(yàn)證圖像的合法性和標(biāo)簽的準(zhǔn)確性。
動(dòng)物面部識(shí)別領(lǐng)域的進(jìn)展受到了阻礙,因?yàn)檠芯咳藛T仍然無法指出能夠用于大規(guī)模準(zhǔn)確識(shí)別動(dòng)物的最優(yōu)特征組合。盡管如此,還是有一些成功的應(yīng)用程序可以對(duì)有限的數(shù)據(jù)進(jìn)行操作,例如識(shí)別一種特定的動(dòng)物或一小群家養(yǎng)或野生動(dòng)物。
如果你正在構(gòu)建自己的動(dòng)物面部識(shí)別系統(tǒng),請(qǐng)記住,動(dòng)物是不合作的生物識(shí)別用戶。有些會(huì)堅(jiān)持舔相機(jī),有些會(huì)拒絕站起來拍照。