算法攻破人臉識(shí)別「口罩」難題,兩天落地千人小區(qū)準(zhǔn)確率達(dá)97% | AI 戰(zhàn)疫
日益成熟的人工智能,正成為抗擊新冠肺炎疫情戰(zhàn)線上一群特別的「逆行者」。
無論是加速前期的疫情科研攻關(guān),還是協(xié)助一線的疫情診療和現(xiàn)場防控,以及后端的信息化平臺(tái)搭建,都已經(jīng)出現(xiàn)了人工智能技術(shù)和解決方案的身影,并且取得了實(shí)際效果。
機(jī)器之心特設(shè)「AI 戰(zhàn)疫專題報(bào)道」,跟蹤人工智能技術(shù)應(yīng)用抗疫現(xiàn)場的最新進(jìn)展及效果,聚焦人工智能工作者英勇抗疫故事。
今天是該系列的第五篇之《社區(qū)保衛(wèi)戰(zhàn):算法攻破人臉識(shí)別「口罩」難題,方案兩天落地千人小區(qū) | AI 戰(zhàn)疫》。
作為城市抗擊疫情的重要單位,社區(qū)在疫情發(fā)展的中后期是不可掉以輕心的關(guān)卡,而一套能夠良好適應(yīng)疫情場景的人臉識(shí)別方案才能稱得上這場戰(zhàn)疫中盡忠職守的「AI 門衛(wèi)」。
南京江寧區(qū)玉堂花園小區(qū)南門,一位戴著口罩的居民走到門禁前,系統(tǒng)很快通過人臉識(shí)別識(shí)別出他的身份和健康狀況,閘機(jī)門自動(dòng)打開。
人臉識(shí)別,在過去一年里高歌猛進(jìn)的 AI 代名詞,紅遍大江南北,無論是鐵路客運(yùn)大廳,還是雜貨店結(jié)賬前臺(tái)都能見到其身影,一時(shí)風(fēng)光無兩。
不料,疫情來襲,當(dāng)大家紛紛戴上口罩,攝像頭背后的它便罷工待斃,再不識(shí)其人了。有專家表示,人臉戴上口罩后隱藏了大部分的面部特征,從而將準(zhǔn)確率降低至 30%。
在疫情面前,人臉識(shí)別顯得雞肋和尷尬,最后還得人工上場。但高傳染性的病毒肆意,非接觸式的檢測識(shí)別方案才是正解。
但 AI 算法之所以強(qiáng)大,在于其迭代與自我進(jìn)化的空間無限。9 天,一家 AI 公司連夜奮戰(zhàn),終于攻破人臉識(shí)別的「口罩」難題,至少在有限的小區(qū)范圍內(nèi),口罩人臉識(shí)別已經(jīng)不再是問題。
01 另辟蹊徑測模型
1 月下旬,疫情正有抬頭之勢,放假節(jié)前,小視科技管理層就開始討論,如何參與這場防疫戰(zhàn)役,他們預(yù)判,疫情會(huì)對(duì)整個(gè)社會(huì)秩序帶來很大影響,也會(huì)波及公司的業(yè)務(wù)發(fā)展。
小視科技,全稱為南京甄視智能科技有限公司,是一家位于南京的人工智能公司,2015 年成立,以人臉識(shí)別技術(shù)為突破口,在安防、零售、教育等行業(yè)落地。
月底,小視科技內(nèi)部緊急啟動(dòng)防疫項(xiàng)目組,結(jié)合已有的解決方案和能力,針對(duì)小區(qū)和企業(yè)的防疫需求快速啟動(dòng)技術(shù)研發(fā)。
決策一經(jīng)達(dá)成,二三十人的作戰(zhàn)小組隨即成立,由技術(shù)研發(fā)人員和產(chǎn)品經(jīng)理組成,進(jìn)行技術(shù)可行性論證。
遮擋下的人臉識(shí)別是業(yè)內(nèi)公認(rèn)的一個(gè)難題。
- 一方面,戴上口罩后,首先因鼻子、嘴巴等五官信息被遮擋,人臉面部可用于辨別的信息會(huì)大幅減少;
- 其次臉部輪廓等可辨別信息也在物理分布上發(fā)生較大變化,因此按照傳統(tǒng)思路訓(xùn)練出的人臉識(shí)別模型,精度都會(huì)出現(xiàn)大幅下降;
- 還有數(shù)據(jù),戴口罩下的人臉數(shù)據(jù)本身就非常缺乏,疫情之下也很難短時(shí)間內(nèi)快速采集數(shù)據(jù),或者找采集公司定制用以訓(xùn)練。
考慮到挑戰(zhàn)難度,小視科技 AI 研究院院長胡建國決定,首先從算法模型上突圍。
此前,團(tuán)隊(duì)已經(jīng)積累的近千個(gè)基礎(chǔ)模型,但是否有與實(shí)際需求匹配尚是個(gè)未知數(shù)。目前,業(yè)界仍然沒有一個(gè)穩(wěn)定且高效的針對(duì)口罩的人臉識(shí)別算法。
進(jìn)行模型評(píng)測要有戴口罩下的人臉測試數(shù)據(jù),管理層緊急發(fā)動(dòng)公司全員及親屬,用了兩天時(shí)間采集一個(gè)小規(guī)模數(shù)據(jù)集。
緊接著遠(yuǎn)程調(diào)用計(jì)算集群進(jìn)行模型評(píng)測,他們找到了一種有效的模型思路——采用眼部特征與整體人臉特征的融合,并結(jié)合注意力機(jī)制增強(qiáng)眼部特征,通過自研的輕量級(jí)網(wǎng)絡(luò),單獨(dú)訓(xùn)練眼部關(guān)鍵點(diǎn)的模型,來提升模型在口罩遮擋下的人臉識(shí)別率。
胡建國解釋,計(jì)算機(jī)視覺中的注意力機(jī)制與人類視覺的選擇性類似,核心目標(biāo)也是從眾多信息中獲取最相關(guān)的信息。佩戴口罩的人臉中眼睛成為了人臉識(shí)別的關(guān)鍵信息,基于口罩的人臉識(shí)別采用眼部關(guān)鍵點(diǎn)和注意力機(jī)制相結(jié)合的方法來增強(qiáng)眼部特征,眼部特征圖與整體人臉特征圖的多級(jí)融合,充分挖掘人臉的有效信息,提升模型在口罩遮擋情況下的表現(xiàn)。
人臉識(shí)別模型注意力機(jī)制效果,第一列表示原圖,第二列表示熱力圖,第三列表示導(dǎo)反向傳播圖,第四列表示導(dǎo)向反向傳播灰度圖,圖中觀察到人眼的區(qū)域得到了更多的關(guān)注。
在人臉識(shí)別模型的訓(xùn)練過程中,胡建國團(tuán)隊(duì)同時(shí)加載預(yù)先訓(xùn)練的眼部關(guān)鍵點(diǎn)網(wǎng)絡(luò)用于特征圖的提取,并與人臉識(shí)別網(wǎng)絡(luò)提取的特征圖相結(jié)合,結(jié)合注意力機(jī)制突出眼部特征,提高識(shí)別的準(zhǔn)確率。
在內(nèi)部測試集中,該模型結(jié)果僅比普通算法模型指標(biāo)低 5%。而在此之前,業(yè)界其他方案的公開口罩人臉識(shí)別仍在 80%-90% 區(qū)間。
該思路此前在通用任務(wù)表現(xiàn)上并不理想,所以沒有推廣開來,但在口罩識(shí)別場景下的表現(xiàn)超出了所有人的預(yù)期。
2 月 4 日,小視 AI 算法團(tuán)隊(duì)拿到模型測試結(jié)果后,胡建國和團(tuán)隊(duì)認(rèn)為模型指標(biāo)下降并不嚴(yán)重,已具備在實(shí)際生產(chǎn)中有效運(yùn)行的可能性。
02 「兩天內(nèi)要試點(diǎn)落地」
模型初步驗(yàn)證之后,一支上百人的隊(duì)伍陸續(xù)投入戰(zhàn)斗,進(jìn)行算法研發(fā),產(chǎn)品準(zhǔn)備。
大年初六以來,由于疫情管制,道路封鎖,和胡建國一樣,許多人都被困到家中,只能通過遠(yuǎn)程協(xié)同辦公。但研發(fā)人員除了基本生活外,幾乎全部精力都投入到工作中,為開發(fā)算法一部分員工甚至通宵作業(yè)。
次日,他們接到了第一個(gè)緊急落地任務(wù),來自南京江寧區(qū)東山街道政府,要求兩天內(nèi)在東山街道玉堂花園小區(qū)進(jìn)行試點(diǎn)落地。
迫切的需求,尚不充分的算法驗(yàn)證,讓研發(fā)團(tuán)隊(duì)承擔(dān)了巨大的壓力。
小視科技也緊急成立各類預(yù)案組,分別負(fù)責(zé)研發(fā)、前線部署、商務(wù)、后勤等工作,全體管理層帶頭,保證所有信息都同步到位,并就每天的工作進(jìn)行匯總、復(fù)盤,保證基本流程不出現(xiàn)問題。
然而特殊時(shí)期問題處處存在,尤其體現(xiàn)在一些基礎(chǔ)支撐上,比如安裝人員難以找尋,這個(gè)過程中必須一遍一遍確認(rèn),確保所有物料、人力、支持資源能夠在第一時(shí)間到位。
玉堂花園常住人口大約 1500~1700 人,部署人臉識(shí)別門禁中,將居民的人臉錄入底庫是重要一步。然而問題是,盡管當(dāng)?shù)毓蔡峁┝藰I(yè)主的人臉數(shù)據(jù),但由于許多租戶的存在,這一數(shù)據(jù)無法使用。
而人工錄入效率低,同時(shí)也存在一定風(fēng)險(xiǎn),研發(fā)團(tuán)隊(duì)為此又專門開發(fā)了一個(gè)便捷錄入的小程序,居民可以現(xiàn)場掃碼在指定區(qū)域完成錄入。
為了盡快做好數(shù)據(jù)錄入,一些街道的志愿者、黨員都參與到協(xié)助中。而居民也出奇地配合,在一天之內(nèi)完成了所有居民的人臉錄入。
2 月 7 日,小視科技完成試點(diǎn)部署。部署中遇到的難度也遠(yuǎn)遠(yuǎn)超過實(shí)驗(yàn)室環(huán)境,胡建國稱,由于口罩緊缺,一些老年人會(huì)戴自制口罩,遮擋范圍可能更多,口罩的樣式也更多樣,在實(shí)際部署中也給他們帶來巨大的壓力。
令人欣慰的是,產(chǎn)品落地后,他們只是調(diào)整了部分算法的閾值與門禁架設(shè)的位置,在不到 2000 人的小區(qū)中,口罩遮擋下的人臉識(shí)別已達(dá)到非常高效的通行。
為了幫助社區(qū)更好的管理居民,他們還推出自定義進(jìn)出規(guī)則系統(tǒng),比如針對(duì)隔離觀察未滿的居民,可以設(shè)置禁止外出;針對(duì)非小區(qū)人員,可以設(shè)置禁止入內(nèi)。
通過戴口罩下的人臉識(shí)別門禁系統(tǒng),社區(qū)可實(shí)現(xiàn)居民的分類管理和精準(zhǔn)識(shí)別,同時(shí)降低接觸風(fēng)險(xiǎn),這對(duì)于處于返程高峰期的社區(qū)可謂是一場及時(shí)雨。
緊接著的 1~2 天中,經(jīng)受住南京各級(jí)領(lǐng)導(dǎo)的視察后,小視科技獲得了政府的認(rèn)可與信任。疫情管控的急迫下,新的任務(wù)隨之而來,政府要求小視科技在數(shù)天內(nèi)完成 數(shù)十個(gè)小區(qū)的部署。
隨后任務(wù)進(jìn)一步加劇,在短時(shí)間內(nèi)部署東山街道 285 個(gè)小區(qū)的壓力也落到小視科技頭上。
03 全面出擊「部署戰(zhàn)」
隨著試點(diǎn)的完成,2 月 7 日當(dāng)天夜里,小視科技已進(jìn)入全員作戰(zhàn)狀態(tài),公司超 80% 的人員全部投身疫情項(xiàng)目中,不論是一線部署,還是遠(yuǎn)程支援。
參與實(shí)際部署的小視科技一線員工來自不同的崗位,有商務(wù)人員,也有技術(shù)人員,反正一旦完成隔離,一定第一時(shí)間去支援前線,去負(fù)責(zé)生產(chǎn)、安裝設(shè)備、解答用戶問題。
部署調(diào)試中的工作人員
胡建國稱,尤其是一線實(shí)施人員,因?yàn)槿肆τ邢?,產(chǎn)品鋪設(shè)點(diǎn)位又多,基本都是白天夜晚兩班倒,緊張的作業(yè)使他們每天都要忙到凌晨,有的甚至工作到凌晨四五點(diǎn)。
算法人員也會(huì)支援一線部署,并帶回產(chǎn)品遇到的問題、技術(shù)改進(jìn)的思路,就這樣爭分奪秒的一版一版更新模型?!? 月 7 日后不到一周的時(shí)間里,我們已經(jīng)完成四五版模型的更新。」他補(bǔ)充道。
一些遠(yuǎn)程支持人員,包括測試人員,甚至行政人員,都被 AI 研究院拉過來做數(shù)據(jù)標(biāo)注與清洗。
緊鑼密鼓推進(jìn)之下,截至 2 月 12 日,在不到五天時(shí)間里,小視科技的這套解決方案已完成 20 余家小區(qū)的生產(chǎn)布署,服務(wù)社區(qū)居民 4 萬余人。除此之外,企業(yè)單位、政府部門等其他場景也正在投入使用。
然而,新的問題又隨之而來。比如小視科技 12 日部署的一個(gè)小區(qū),住戶達(dá) 2500 戶,常住人口近萬人,如此大的人口規(guī)模對(duì)于技術(shù)帶來新的挑戰(zhàn)。
這是因?yàn)楫?dāng)人口達(dá)到一定規(guī)模后,比如在幾十萬人中,總可以找到一些眼睛非常相似的人,當(dāng)嘴巴鼻子等有效信息被遮擋后,分辨率相應(yīng)就會(huì)降低?!肝覀?cè)谌斯ず蓑?yàn)后臺(tái)數(shù)據(jù)的時(shí)候,已經(jīng)遇到一些數(shù)據(jù),人也沒有辦法分辨?!购▏Q。
「天生的數(shù)據(jù)局限性,還有人臉有效信息的缺失,會(huì)導(dǎo)致人臉識(shí)別在應(yīng)用中挑戰(zhàn)非常大?!?/p>
在迫切的疫情管控與政府殷切的期望之下,小視 AI 算法團(tuán)隊(duì)在緊張迭代模型時(shí),也承擔(dān)了不小的壓力?!肝覀兘o自己定的目標(biāo)是,在半個(gè)月之內(nèi),一定要支持大概 2 萬人。」
與此同時(shí),因?yàn)楣?yīng)鏈緊缺而被擱置的紅外測溫設(shè)備,小視科技也正在研發(fā)迭代中,他稱最快可能一周之內(nèi),就會(huì)試點(diǎn) AI 測溫功能的人臉識(shí)別門禁產(chǎn)品。