當(dāng)計(jì)算機(jī)視覺(jué)遇到硅谷歸來(lái)的創(chuàng)業(yè)者——專訪格靈深瞳聯(lián)合創(chuàng)始人兼CTO趙勇
原創(chuàng)計(jì)算機(jī)視覺(jué)是自二十世紀(jì)六十年代中期迅速發(fā)展起來(lái)的一門(mén)新學(xué)科。計(jì)算機(jī)視覺(jué)是使用計(jì)算機(jī)及相關(guān)設(shè)備對(duì)生物視覺(jué)的一種模擬,主要任務(wù)是通過(guò)對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的視覺(jué)信息,就像人類和許多其他類生物每天所做的那樣。計(jì)算機(jī)視覺(jué)在工農(nóng)業(yè)生產(chǎn),安防,地質(zhì)學(xué),交通,醫(yī)學(xué)及軍事學(xué)等等領(lǐng)域有著極大潛在的應(yīng)用價(jià)值,所以它在國(guó)際上越來(lái)越受到重視。比爾蓋茨曾說(shuō):IT界的下一個(gè)大事件是計(jì)算機(jī)視覺(jué)(computer vision)與深度學(xué)習(xí)(deep learning)的結(jié)合。早在前年6月中旬訪問(wèn)北京時(shí),他到訪的***家創(chuàng)業(yè)公司就是一家計(jì)算機(jī)視覺(jué)的公司。這家公司就是格靈深瞳,曾在2014年獲得來(lái)自紅杉的數(shù)千萬(wàn)美元B輪融資。坐落在頤和園邊、西山河畔,有一個(gè)小橋流水亭臺(tái)樓閣的28畝院子。
近日,51CTO的記者有幸采訪了格靈深瞳聯(lián)合創(chuàng)始人兼CTO趙勇。趙勇是美國(guó)布朗大學(xué)計(jì)算機(jī)工程系的博士,畢業(yè)后供職于Google總部研究院任資深研究員,他也是Google Glass最早期的核心研發(fā)成員,2013年4月作為聯(lián)合創(chuàng)始人創(chuàng)立格靈深瞳。
格靈深瞳聯(lián)合創(chuàng)始人兼CTO趙勇
格靈深瞳致力于讓計(jì)算機(jī)看懂世界,用廣泛的視覺(jué)傳感器網(wǎng)絡(luò),構(gòu)建真實(shí)世界的搜索引擎。2013年4月,趙勇作為聯(lián)合創(chuàng)始人創(chuàng)立格靈深瞳,作為***技術(shù)官,帶領(lǐng)技術(shù)團(tuán)隊(duì)成功研發(fā)出了“深瞳無(wú)人監(jiān)控安防系統(tǒng)”,一舉解決了傳統(tǒng)安防監(jiān)控行業(yè)“看不見(jiàn)”和“找不到”的行業(yè)基本痛點(diǎn)。傳統(tǒng)的安防監(jiān)控中心,一個(gè)保安需要同時(shí)看幾十上百路視頻,即使發(fā)生了異常事件,能夠被保安看到的概率也是非常小的;而當(dāng)一件事情發(fā)生以后,需要靠人力去大量的硬盤(pán)數(shù)據(jù)里面尋找線索,這是一項(xiàng)極其浩大的工程,耗時(shí)特別長(zhǎng),效率特別低,而格靈深瞳的產(chǎn)品可以很好地解決這兩個(gè)行業(yè)瓶頸。
2014年4月格靈深瞳首款產(chǎn)品“深瞳無(wú)人監(jiān)控安防系統(tǒng)”工程樣機(jī)開(kāi)發(fā)完成,并得到國(guó)有四大銀行中三家大行的青睞,10月開(kāi)始在多省市進(jìn)行全面售前測(cè)試。該套系統(tǒng)可以解決傳統(tǒng)安防行業(yè)的發(fā)展瓶頸,直擊行業(yè)痛點(diǎn),具有巨大的市場(chǎng)潛力和開(kāi)拓能力。
創(chuàng)立格靈深瞳源于好奇心的驅(qū)使
趙勇畢業(yè)于美國(guó)布朗大學(xué),曾在三菱電器研究所、愛(ài)普生實(shí)驗(yàn)室、Nvidia實(shí)驗(yàn)室和惠普實(shí)驗(yàn)室擔(dān)任實(shí)習(xí)研究員。2010年起,供職于谷歌總部研究院任資深研究員。這些公司無(wú)疑都是業(yè)界的標(biāo)桿,為何還要走上創(chuàng)業(yè)這條充滿艱辛的路?趙勇的回答是:好奇心。就是想嘗試一下重新開(kāi)始做一個(gè)團(tuán)隊(duì)是什么感覺(jué)。在談到51CTO的線下中高端技術(shù)人學(xué)習(xí)平臺(tái)CTO訓(xùn)練營(yíng)的時(shí)候,趙勇也談到對(duì)CTO這個(gè)崗位以及技術(shù)管理的理解。首先是三年多的創(chuàng)業(yè)經(jīng)歷讓趙勇感受到了中西方團(tuán)隊(duì)的氛圍的不同。在西方國(guó)家的企業(yè),無(wú)論是技術(shù)層面還是企業(yè)文化都比中國(guó)的更專業(yè)化,而中國(guó)企業(yè)的人情味更濃。自己也是一直在平衡著這種不同,把西方文化、企業(yè)管理比較適合中國(guó)的引進(jìn)進(jìn)來(lái),同時(shí),不斷學(xué)習(xí)本土企業(yè)文化。
格靈深瞳在做什么
格靈深瞳將計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)技術(shù)應(yīng)用于商業(yè)領(lǐng)域,自主研發(fā)的深瞳技術(shù)在人和車(chē)的檢測(cè)、跟蹤與識(shí)別方面居于***水平。目前公司已將其應(yīng)用到了安防監(jiān)控和智能交通領(lǐng)域,推出了顛覆行業(yè)的突破性產(chǎn)品。
主要技術(shù)有:
1.三維計(jì)算機(jī)視覺(jué)
三維計(jì)算機(jī)視覺(jué)和傳統(tǒng)的二維圖像處理技術(shù)相比,增加了物體的深度信息,更完整的真實(shí)的還原了物體信息,解決了相互遮擋、比例混淆、影隨人動(dòng)的問(wèn)題,提高了智能檢測(cè)和分析的準(zhǔn)確度。
2.深度學(xué)習(xí)
深度學(xué)習(xí)是由傳統(tǒng)神經(jīng)網(wǎng)絡(luò)發(fā)展的一類機(jī)器學(xué)習(xí)算法。通過(guò)類似腦神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,讓計(jì)算機(jī)像人一樣在真實(shí)世界中吸收、學(xué)習(xí)和理解復(fù)雜的信息,完成高難度的識(shí)別任務(wù)。
主要產(chǎn)品有:
1.皓目行為分析儀:劃時(shí)代意義的安防產(chǎn)品,真正意義上的人工智能。
2.威目車(chē)輛特征識(shí)別系統(tǒng):基于深度學(xué)習(xí)的新一代車(chē)輛識(shí)別引擎,以在線云服務(wù)、離線SDK、軟硬一體的產(chǎn)品形式讓企業(yè)級(jí)用戶和直接業(yè)務(wù)部門(mén)可以快速應(yīng)用***的車(chē)輛識(shí)別技術(shù)。
3.威目視圖大數(shù)據(jù)系統(tǒng):基于視圖結(jié)構(gòu)化提取的車(chē)型、車(chē)系、年款等關(guān)鍵信息,對(duì)套牌車(chē)、假牌車(chē)的分析進(jìn)行有力比對(duì);利用人體/人臉結(jié)構(gòu)化識(shí)別的信息,對(duì)目標(biāo)嫌疑人員進(jìn)行快速定位;配合結(jié)構(gòu)化特征信息,對(duì)嫌疑車(chē)輛/人員實(shí)行快速的以圖搜圖應(yīng)用,大幅提高利用效率。
趙勇透露:“格靈深瞳目前同時(shí)進(jìn)入了三個(gè)領(lǐng)域;安全、汽車(chē)、醫(yī)療。最近剛剛分拆出了多家公司,每個(gè)團(tuán)隊(duì)都在各自細(xì)分領(lǐng)域里面去做,而它所依賴的核心知識(shí)基本上是一致的。”
我們不是微軟Kinect,不是PrimeSense,也不是Asus Xtion。
“我們不是微軟Kinect,不是PrimeSense,也不是Asus Xtion。我們的產(chǎn)品不是傳感器元件本身。事實(shí)上,傳感器公司是我們的合作伙伴。我們的傳感器網(wǎng)絡(luò)中適配的也不僅僅是一款三維傳感器。因?yàn)椴煌膫鞲衅髂芰瓦m用條件不同,有時(shí)候我們需要把多種傳感器集成在一個(gè)外殼下。目前,格靈深瞳正在和幾乎全世界所有的三維傳感器公司合作,把這種偉大的技術(shù)帶到各種完全不同的應(yīng)用領(lǐng)域。目前我們的產(chǎn)品線包括適用于微小空間的手勢(shì)識(shí)別、適用于室內(nèi)中等空間和室外大空間的行為識(shí)別,適用于汽車(chē)的全天候路況和駕駛安全識(shí)別,以及適用于道路檢測(cè)的車(chē)輛和行人行為識(shí)別。”趙勇告訴記者。
既然格靈深瞳是軟件公司,那和微軟的Kinect,以及PrimeSense主導(dǎo)的OpenNI等人機(jī)交互技術(shù)有什么區(qū)別呢?上述兩種技術(shù)解決的問(wèn)題是在近距離空間里的人為了和面前的計(jì)算機(jī)之間進(jìn)行主動(dòng)交互的姿態(tài)識(shí)別問(wèn)題。這樣的技術(shù)是專門(mén)為了游戲機(jī)和電視遙控等客廳場(chǎng)景設(shè)計(jì)的。而格靈深瞳面對(duì)的客戶場(chǎng)景更大,人更多,人們的行為不是為了配合交互而且更加復(fù)雜,因此往往要處理人與人之間的重疊遮擋問(wèn)題。格靈深瞳在人體動(dòng)作分析方面的技術(shù)是專門(mén)針對(duì)這種現(xiàn)實(shí)場(chǎng)景的挑戰(zhàn)而設(shè)計(jì)的。
計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)的區(qū)別
對(duì)于這個(gè)問(wèn)題,趙勇表示,計(jì)算機(jī)視覺(jué)是一個(gè)更大的領(lǐng)域。其中一個(gè)應(yīng)用領(lǐng)域是在工業(yè),一個(gè)例子是質(zhì)量控制。這時(shí)也被稱為機(jī)器視覺(jué)。所以可以說(shuō),計(jì)算機(jī)視覺(jué)是一個(gè)更大的領(lǐng)域,機(jī)器視覺(jué)一般來(lái)講是一個(gè)比較狹義的概念。
計(jì)算機(jī)視覺(jué)對(duì)51CTO的線下中高端技術(shù)人學(xué)習(xí)平臺(tái)CTO訓(xùn)練營(yíng)來(lái)說(shuō),也是一個(gè)全新的領(lǐng)域。
人工智能一直是一個(gè)失敗者,但它必須成功
有人說(shuō)計(jì)算機(jī)視覺(jué)是人工智能的下一個(gè)科技前沿,但趙勇認(rèn)為“人工智能一直是一個(gè)失敗者,但它必須成功。” 人們對(duì)人工智能的理解,可能最早要推到二戰(zhàn)的時(shí)候,計(jì)算機(jī)用于去破解敵方的密碼。后來(lái)很多理論學(xué)家、計(jì)算機(jī)學(xué)家出現(xiàn),這個(gè)領(lǐng)域差不多也興旺過(guò)三四次,但最終都銷聲匿跡了。這次是一個(gè)新的浪潮,有三個(gè)特點(diǎn):***,技術(shù)進(jìn)入到了實(shí)用領(lǐng)域。第二,今天人工智能做的有些事情能力上甚至超過(guò)了人。第三,今天的技術(shù)已經(jīng)有了很多行業(yè)化的應(yīng)用,一旦有了商業(yè)化的應(yīng)用后,這個(gè)領(lǐng)域獲得的資源就不一樣了,以前都是國(guó)家撥經(jīng)費(fèi),現(xiàn)在變成了金融領(lǐng)域的投資,因?yàn)榇蠹矣X(jué)得它可能快成熟了。
人工智能必須要成功,因?yàn)槲覀內(nèi)绻氤阶约旱脑?,就只能靠人工智能的幫助了?/p>
計(jì)算機(jī)視覺(jué)下一個(gè)應(yīng)用
說(shuō)到計(jì)算機(jī)視覺(jué)未來(lái)的應(yīng)用方向,趙勇認(rèn)為安全、無(wú)人駕駛、醫(yī)療、機(jī)器人將是計(jì)算機(jī)視覺(jué)接下來(lái)的主要應(yīng)用領(lǐng)域。
我們未來(lái)的生活可能每個(gè)毛孔里都有人工智能,未來(lái),深瞳技術(shù)的開(kāi)放平臺(tái)將不斷把格靈深瞳***的技術(shù)提供給廣大合作伙伴,為各行各業(yè)帶來(lái)最有效的技術(shù)解決方案。