蘑菇街民達(dá):人臉技術(shù)在電商平臺的應(yīng)用實踐
原創(chuàng)【51CTO.com原創(chuàng)稿件】2016 年11月25-26日,WOT2016大數(shù)據(jù)峰會在北京粵財JW萬豪酒店召開,50多位大數(shù)據(jù)領(lǐng)域一線專家、數(shù)據(jù)技術(shù)先行者齊聚現(xiàn)場,在圍繞數(shù)據(jù)智能、大數(shù)據(jù)商業(yè)、區(qū)塊鏈、實時計算、系統(tǒng)架構(gòu)、NoSQL等前沿技術(shù)話題展開深度交流和溝通探討的同時,分享大數(shù)據(jù)領(lǐng)域***實踐和最熱門的行業(yè)應(yīng)用。
在WOT2016大數(shù)據(jù)技術(shù)峰會算法與模型分會場, 蘑菇街圖像視頻算法負(fù)責(zé)人張洪明(民達(dá))做了主題為“人臉技術(shù)在電商平臺的應(yīng)用實踐”的演講,51CTO記者在峰會現(xiàn)場對其進(jìn)行了專訪。
【受訪人簡介】
張洪明(民達(dá))·蘑菇街圖像視頻算法負(fù)責(zé)人
張洪明(蘑菇街花名:民達(dá))2015年加入蘑菇街,負(fù)責(zé)美麗聯(lián)合集團(tuán)圖像技術(shù)的研發(fā)工作,創(chuàng)建和帶領(lǐng)一個算法團(tuán)隊,與工程和業(yè)務(wù)團(tuán)隊合作,為集團(tuán)提供圖像技術(shù)支持。主要工作包括:圖像搜索、圖像識別、商品圖像內(nèi)容分析等;業(yè)務(wù)涉及電商導(dǎo)購、直播等場景。在加入蘑菇街之前,分別在NEC中國研究院、阿里巴巴集團(tuán),從事圖像技術(shù)和機(jī)器學(xué)習(xí)的研究和應(yīng)用。
張洪明表示,近幾年,隨著深度學(xué)習(xí)的流行,基于深度學(xué)習(xí)的人臉技術(shù)開始逐漸出現(xiàn),并取得了不錯的成績。如基于Faster-RCNN的人臉檢測算法在FDDB上名列***、Google的FaceNet在LFW上取得了99.63%的人臉識別***成績、Face++基于CNN的人臉特征點定位算法也在公開數(shù)據(jù)集300W上取得了***的成績。然而,深度學(xué)習(xí)對于大量計算資源的需求和復(fù)雜的模型(幾十MB到幾百MB),使得上述技術(shù)難以應(yīng)用在移動端,傳統(tǒng)算法雖在性能上不及深度學(xué)習(xí),但其計算資源消耗少、模型簡單的優(yōu)勢,更適合應(yīng)用在目前的移動設(shè)備上。因此,基于傳統(tǒng)算法和基于深度學(xué)習(xí)的人臉技術(shù)目前在業(yè)界處于并存狀態(tài)。但隨著處理器的發(fā)展和針對深度學(xué)習(xí)的優(yōu)化技術(shù)逐漸成熟,基于深度學(xué)習(xí)的人臉技術(shù)勢必在將來更加普及。
人臉技術(shù)概述和應(yīng)用場景
蘑菇街自2015年起,開始人臉技術(shù)的自主研發(fā)。已完成人臉檢測、人臉特征點定位、人臉識別等多種技術(shù)的SDK、服務(wù)開發(fā)。主要服務(wù)于圖片社交、電商直播、支付金融等業(yè)務(wù)。
蘑菇街作為電商的APP,女性用戶相對較多一些。用到人臉技術(shù)的場景也很多,如直播頻道、后續(xù)特效、針對電商選品,模特紅人視覺等。
人臉技術(shù)在移動端如何保證時間效果
張洪明表示,時間和效果的問題更加突出在移動端開發(fā)上,尤其是直播部分需要實時播放,這樣對性能要求會更高。在整個處理過程中,除了做人臉圖像處理,還需考慮到視頻編碼、轉(zhuǎn)碼、播放等業(yè)務(wù)流程。做人臉檢測、特征定位等技術(shù)用時當(dāng)然是越小越好,目前電商直播環(huán)境下蘑菇街的人臉技術(shù)在人臉前期處理上10毫秒之內(nèi)就能夠完成,
這是怎么做到的呢?民達(dá)表示,蘑菇街會對算法做很多優(yōu)化,如參數(shù)和計算定點化技術(shù)。最主要是在算法模型上做深入優(yōu)化,在速度和效果之間達(dá)到一個平衡。在直播當(dāng)中,并不一定要用***的識別性能,但保證時間效果比較關(guān)鍵。
人臉技術(shù)在算法分類上的不足
從算法分類來講,當(dāng)下在業(yè)界,基于深度學(xué)習(xí)人臉圖像技術(shù)性能相對較好,而且效果已經(jīng)遠(yuǎn)遠(yuǎn)超出傳統(tǒng)的方法。但不足的是其模型較大,對計算資源的消耗也較大,導(dǎo)致在移動設(shè)備上還有挑戰(zhàn),在這種情況下,現(xiàn)在在移動端還是用傳統(tǒng)的方法來解決業(yè)務(wù)的問題。
在將來,隨著深度學(xué)習(xí)本身技術(shù)的優(yōu)化,隨著硬件條件不斷地提升,在移動端能夠把深度學(xué)習(xí)這樣的一些技術(shù)也運用在實時的場景下,這是蘑菇街接下來重點突破的,不管在理論還是實踐都要面臨的課題。
采訪***,張洪明說道:“針對人臉技術(shù)來說,對于初創(chuàng)企業(yè),要先滿足業(yè)務(wù),用一些開源算法或第三方采購算法,把業(yè)務(wù)先做起來,然后再去開發(fā)自己可以獨立掌握的技術(shù)。根據(jù)公司的技術(shù)水平,可以從簡單到復(fù)雜的路徑,我們可以從相對簡單傳統(tǒng)的算法開始,再涉及到更復(fù)雜需要資源消耗深度學(xué)習(xí)的算法,這樣逐步的去迭代。
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】