圖像識別技術(shù)落地 探索多樣化應(yīng)用場景
Alpha Go的勝利讓人工智能的“深度學(xué)習(xí)”概念迅速普及,而率先打破“機(jī)器學(xué)習(xí)”、過渡到“深度學(xué)習(xí)”的節(jié)點(diǎn)便發(fā)生在圖像識別領(lǐng)域。
根據(jù)平安證券的《通信行業(yè)人工智能圖像識別專題報(bào)告》,圖像識別分為生物識別、物體與場景識別和視頻識別。據(jù)估算,到2020年,生物識別技術(shù)市場規(guī)模將達(dá)到250億美元,5年內(nèi)年均增速約14%。其中,人臉識別增速最快,將從2015年的9億美元增長到2020年的24億美元。
在各式的場景應(yīng)用中,當(dāng)下以人臉識別最為普遍,并且機(jī)器已經(jīng)高于人類的識別能力。在兩周前的《***大腦》中,百度***科學(xué)家吳恩達(dá)帶著小度機(jī)器人和人類選手比拼,在人臉識別項(xiàng)目以3:2取勝。但是,在聯(lián)想和常識理解的能力上,圖像識別遠(yuǎn)未能和人類比肩,相關(guān)公司正在積極切入垂直行業(yè)應(yīng)用中。
圖像識別落地
圖像識別背后的技術(shù)就是新的機(jī)器學(xué)習(xí)方式,即深度學(xué)習(xí)。具體來說,在數(shù)據(jù)的基礎(chǔ)上,計(jì)算機(jī)自動生成特征量,而非人為設(shè)置特征量,然后計(jì)算機(jī)根據(jù)這些特征量來進(jìn)行分類。
“相比2012年時(shí)的技術(shù),這些年圖像識別再次突飛猛進(jìn),”數(shù)相科技CEO鄧立邦告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,“從技術(shù)角度來說,入門容易,從0做到40、60分相對門檻較低,要提升到90分就需要深厚的模型。”
圖像識別技術(shù)的迅速落地有多方面原因,一方面,很多大企業(yè)已經(jīng)開源了基本工具,鄧立邦談道:“就人臉識別來說,有很多學(xué)術(shù)機(jī)構(gòu)已經(jīng)做了相當(dāng)長時(shí)間的研究,發(fā)了很多論文,論文也已經(jīng)接入到實(shí)際的應(yīng)用中。但是人臉之外,例如情緒仍舊是比較難的話題。”
另一方面,產(chǎn)業(yè)鏈的更新迭代也為圖像技術(shù)打下基矗平安證券的報(bào)告中提到,高性能的AI 計(jì)算芯片、深度學(xué)習(xí)算法都是推動圖像識別發(fā)展的因素。其中,AI 底層架構(gòu)從CPU+GPU 到FPGA,再到人工智能專用芯片,運(yùn)行表現(xiàn)不斷刷新,目前英偉達(dá)的DGX-1芯片在程序運(yùn)行速度上比舊版GPU 加速解決方案快12倍。
圖普科技方面也告訴記者,近年來,得益于計(jì)算機(jī)速度的提升、大規(guī)模集群技術(shù)的興起、GPU的應(yīng)用以及眾多優(yōu)化算法的出現(xiàn),耗時(shí)數(shù)月的訓(xùn)練過程可縮短為數(shù)天甚至數(shù)小時(shí),深度學(xué)習(xí)才逐漸可用于工業(yè)化。
應(yīng)用場景多樣化
盡管還未達(dá)到真正的人工智能,但日漸成熟的圖像識別技術(shù)已開始探索各類行業(yè)的應(yīng)用。此前圖普科技CEO李明強(qiáng)就告訴記者,現(xiàn)在重要的是將人工智能切入到具體行業(yè)中,在垂直行業(yè)中獲取和管理大數(shù)據(jù)。
據(jù)悉,在農(nóng)林行業(yè),圖像識別技術(shù)已經(jīng)得到應(yīng)用。中國林產(chǎn)業(yè)協(xié)會非洲分會秘書長丁磊向21世紀(jì)經(jīng)濟(jì)報(bào)道記者介紹道:“木材的生產(chǎn)包含多個(gè)環(huán)節(jié),過去這些環(huán)節(jié)往往牽涉到大量的人力投入。如今,圖像識別已在多個(gè)環(huán)節(jié)中得到應(yīng)用,例如森林調(diào)查,通過無人機(jī)對圖像進(jìn)行采集,再通過圖像分析系統(tǒng)對森林樹種的覆蓋比例、林木的健康狀況進(jìn)行分析,從而可以做出更科學(xué)的開采方案。而原木檢驗(yàn)方面,圖像識別可以快速對木材的樹種、優(yōu)劣、規(guī)格進(jìn)行判斷,省去了大量人工參與的環(huán)節(jié)。”
平安證券在研究報(bào)告中舉例道,在金融領(lǐng)域,身份識別和智能支付將提高身份安全性與支付的效率和質(zhì)量;在安防領(lǐng)域,未來在仍硬件鋪設(shè)到后端軟件管理平臺的建設(shè)轉(zhuǎn)型中,圖像識別系統(tǒng)將成為打造智慧城市的核心環(huán)節(jié);在醫(yī)療領(lǐng)域,醫(yī)療影像基于人工智能的快速匹配可幫助醫(yī)生更快更準(zhǔn)確的讀取病人的影像數(shù)據(jù);在無人駕駛領(lǐng)域,低成本的攝像頭加視頻處理軟件方案將為無人駕駛商業(yè)化打下基矗
此外,智能家居、電商等行業(yè)中,圖像識別也有不同程度的應(yīng)用。從目前的應(yīng)用案例來看,以To B行業(yè)居多,當(dāng)然不乏Face++等To C類產(chǎn)品。在深度學(xué)習(xí)之下,各公司面向不同行業(yè),培育掌握不同知識的圖像識別機(jī)器。未來,如何在圖像的基礎(chǔ)上收集、處理大數(shù)據(jù)將成為行業(yè)內(nèi)各玩家的另一個(gè)比拼點(diǎn)。