2021了你還不知道數(shù)據(jù)標(biāo)注?人工智能為什么需要數(shù)據(jù)標(biāo)注
“得數(shù)據(jù)者,得人工智能”。如今人工智能早已在我們的生活中屢見不鮮,像“Siri”、“指紋解鎖”、“人臉識(shí)別”等等都屬于人工智能的范疇,然而人工智能的上游基礎(chǔ)產(chǎn)業(yè),數(shù)據(jù)標(biāo)注卻鮮為人知。數(shù)據(jù)標(biāo)注是一個(gè)極為龐大的產(chǎn)業(yè),在數(shù)標(biāo)行業(yè)內(nèi)部,從業(yè)者也必將隨著AI行業(yè)而一同進(jìn)入細(xì)分市場追逐階段,可謂機(jī)遇與挑戰(zhàn)并行,為創(chuàng)業(yè)者創(chuàng)造力大量的機(jī)會(huì),為社會(huì)造就了大量新興的就業(yè)機(jī)會(huì)。那么數(shù)據(jù)標(biāo)注的應(yīng)用場景都有哪些,它為什么如此火熱呢?
數(shù)據(jù)標(biāo)注的應(yīng)用場景
人臉識(shí)別
人臉識(shí)別也稱人像識(shí)別、面部識(shí)別,是基于人的臉部特征信息進(jìn)行多年齡段、多角度、多表情、多光線的人臉圖像采集,從而完成身份識(shí)別的一種生物識(shí)別技術(shù)。人臉識(shí)別涉及的技術(shù)主要包括計(jì)算機(jī)視覺、圖像處理等。
人臉識(shí)別(視覺識(shí)別技術(shù)的一種應(yīng)用)在國內(nèi)的應(yīng)用大致經(jīng)歷從公共安全領(lǐng)域擴(kuò)展到商業(yè)領(lǐng)域的過程。最初,機(jī)場、高鐵站以及酒店等場景使用這項(xiàng)技術(shù)對(duì)個(gè)人身份進(jìn)行驗(yàn)證,隨后商業(yè)銀行也開始采用人臉識(shí)別實(shí)現(xiàn)遠(yuǎn)程開戶。再之后,刷臉支付、刷臉門禁也相繼出現(xiàn),人臉識(shí)別逐漸從少數(shù)有限場景滲透到人們的日常生活之中,目前,人臉識(shí)別技術(shù)已廣泛應(yīng)用于多個(gè)領(lǐng)域,如金融、司法、公安、邊檢、航天、電力、教育、醫(yī)療等。
隨著人臉識(shí)別技術(shù)的進(jìn)一步成熟和社會(huì)認(rèn)同度的提高,其將應(yīng)用在更多領(lǐng)域,給人們的生活帶來更多改變。
智能交通
近年來,隨著人工智能浪潮的興起,無人駕駛、智能交通安全系統(tǒng)一度走進(jìn)我們的生活,國內(nèi)許多公司紛紛投入到自動(dòng)駕駛和無人駕駛的研究,例如百度啟動(dòng)的“百度無人駕駛汽車”計(jì)劃,其自主研發(fā)的無人駕駛汽車Apollo還曾亮相2018年央視春晚。
再比如近日上海街頭出現(xiàn)的地鎖停車黑科技,當(dāng)你停好車,協(xié)管員就會(huì)協(xié)管員將一張停車提示卡置于門把手上。停車7分鐘后,停車位下的指示燈由綠轉(zhuǎn)紅,金屬地鎖升起,卡住車身底盤。取車時(shí),用手機(jī)掃了掃地面上的二維碼,停車時(shí)長、費(fèi)用信息一目了然。支付停車費(fèi)后,地面指示燈由紅轉(zhuǎn)綠,地鎖降下,電子發(fā)票也能實(shí)時(shí)獲取。
而這些都要依賴于人工智能數(shù)據(jù)標(biāo)注的介入,對(duì)于行車視頻進(jìn)行采集,路況進(jìn)行提取,停車點(diǎn)進(jìn)行標(biāo)注,包括D點(diǎn)云障礙物、紅綠燈、車道燈及高精地圖。為行人識(shí)別、車輛識(shí)別、紅綠燈識(shí)別、車道線識(shí)別等技術(shù)提供精確訓(xùn)練數(shù)據(jù),為智能交通保駕護(hù)航。
智能語音
智能語音即實(shí)現(xiàn)人與機(jī)器以語言為紐帶的通信。人類大腦皮層每天處理的信息中,聲音信息占20%,它是溝通最重要的紐帶。人類對(duì)機(jī)器語音識(shí)別的探索始于20世紀(jì)50年代,迄今已逾70年。2016年,在深度神經(jīng)網(wǎng)絡(luò)的幫助下,機(jī)器語音識(shí)別準(zhǔn)確率第一次達(dá)到人類水平,意味著智能語音技術(shù)落地期到來。
數(shù)據(jù)標(biāo)注主要在語音方面的應(yīng)用場景主要是語音語言采集,語音內(nèi)容加工處理,情感判斷,語音文字等轉(zhuǎn)化。為語音識(shí)別(ASR)、語音合成(TTS)等提高質(zhì)量語音數(shù)據(jù)讓您的智能設(shè)備更懂得用戶心聲。我們常用到的小愛同學(xué)、天貓靜音,手機(jī)語音輸入,甚至包括有時(shí)候接到的營銷電話都有著智能語音的身影。
圖像處理之醫(yī)學(xué)圖像
醫(yī)學(xué)圖像處理是目前人工智能在醫(yī)療領(lǐng)域的典型應(yīng)用,它的處理對(duì)象是由各種不同成像機(jī)理,如在臨床醫(yī)學(xué)中廣泛使用的核磁共振成像、超聲成像等生成的醫(yī)學(xué)影像。
傳統(tǒng)的醫(yī)學(xué)影像診斷,主要通過觀察二維切片圖去發(fā)現(xiàn)病變體,這往往需要依靠醫(yī)生的經(jīng)驗(yàn)來判斷。而利用計(jì)算機(jī)圖像處理技術(shù),可以對(duì)醫(yī)學(xué)影像進(jìn)行圖像分割、特征提取、定量分析和對(duì)比分析等工作,進(jìn)而完成病灶識(shí)別與標(biāo)注,針對(duì)腫瘤放療環(huán)節(jié)的影像的靶區(qū)自動(dòng)勾畫,以及手術(shù)環(huán)節(jié)的三維影像重建。
該應(yīng)用可以輔助醫(yī)生對(duì)病變體及其他目標(biāo)區(qū)域進(jìn)行定性甚至定量分析,從而大大提高醫(yī)療診斷的準(zhǔn)確性和可靠性。另外,醫(yī)學(xué)圖像處理在醫(yī)療教學(xué)、手術(shù)規(guī)劃、手術(shù)仿真、各類醫(yī)學(xué)研究、醫(yī)學(xué)二維影像重建中也起到重要的輔助作用。
得數(shù)據(jù)者,得人工智能
人工智能主要算法應(yīng)用領(lǐng)域集中在計(jì)算機(jī)視覺、語音識(shí)別/語音合成,以及自然語言處理三個(gè)方面。
圖像方面:一個(gè)新研發(fā)的計(jì)算機(jī)視覺算法需要上萬張到數(shù)十萬張不等的標(biāo)注圖片訓(xùn)練,新功能的開發(fā)需要近萬張圖片訓(xùn)練,而定期優(yōu)化算法也有上千張圖片的需求,一個(gè)用于智慧城市的算法應(yīng)用,每年都有數(shù)十萬張圖片的穩(wěn)定需求。
語音方面:頭部公司累計(jì)應(yīng)用的標(biāo)注數(shù)據(jù)集已達(dá)百萬小時(shí)以上,每年需求仍以20%-30%的增速上升,要求數(shù)據(jù)服務(wù)商不僅要掌握專業(yè)的聲學(xué)知識(shí)、數(shù)據(jù)標(biāo)注經(jīng)驗(yàn),還要擁有語音合成的算法能力。
自然語言處理方面:隨著工業(yè)、醫(yī)療、教育的AI應(yīng)用產(chǎn)品進(jìn)一步爆發(fā),將會(huì)有更多交互方式出現(xiàn),自然語義數(shù)據(jù)處理的需求將會(huì)持續(xù)增長,有望成為繼圖像、語音之后的第三大增量市場。
這些海量的數(shù)據(jù)幾乎全部依賴數(shù)據(jù)標(biāo)注師手工進(jìn)行標(biāo)注,數(shù)據(jù)標(biāo)注行業(yè)的缺口十分可觀,并且數(shù)據(jù)標(biāo)注已經(jīng)在各行業(yè)產(chǎn)生了極廣的應(yīng)用,行業(yè)也開始逐漸升級(jí),走向產(chǎn)業(yè)化。在行業(yè)發(fā)展的過程中,行業(yè)人才的培養(yǎng)必然是最大的內(nèi)驅(qū)力。
“得數(shù)據(jù)者,得人工智能”。未來,隨著AI應(yīng)用場景逐漸多領(lǐng)域化,在數(shù)據(jù)標(biāo)注行業(yè)內(nèi)部,從業(yè)者也必將隨著AI行業(yè)而一同進(jìn)入細(xì)分市場追逐階段,可謂機(jī)遇與挑戰(zhàn)并行。