極限元:彰顯技術(shù)實(shí)力 搶灘人工智能高地
有人表示,2016年的人工智能=1996年的互聯(lián)網(wǎng)=1976年的PC,更有人預(yù)測(cè),人工智能將會(huì)是比移動(dòng)互聯(lián)網(wǎng)大一千倍的市場(chǎng),下一個(gè)BAT級(jí)的公司或許就從人工智能里面產(chǎn)生。”未來的人工智能會(huì)細(xì)化方向,會(huì)有越來越多的專業(yè)公司出現(xiàn),而一家大公司一統(tǒng)江山的局面會(huì)逐漸打破。“極限元(北京)智能科技股份有限公司CTO車浩博士對(duì)記者說。
車浩于中國科學(xué)院自動(dòng)化研究所模式識(shí)別專業(yè)博士畢業(yè),國家重點(diǎn)實(shí)驗(yàn)室助理研究員,先后參與多項(xiàng)國家級(jí)項(xiàng)目(863、國家自然科學(xué)基金),曾擔(dān)任校企合作項(xiàng)目寶馬汽車人機(jī)交互查詢系統(tǒng)、三星葡語語音合成系統(tǒng)、聯(lián)想手機(jī)語音合成系統(tǒng)負(fù)責(zé)人;其“高表現(xiàn)力語音合成技術(shù)”曾獲北京市科技進(jìn)步二等獎(jiǎng),主要研究方向?yàn)檎Z音合成與識(shí)別、多模態(tài)人機(jī)交互、計(jì)算機(jī)視覺等方向。
作為極限元聯(lián)合創(chuàng)始人的車浩,首先在智能語音技術(shù)上破冰,而后在計(jì)算機(jī)視覺和虛擬現(xiàn)實(shí)等技術(shù)上取得卓有成效的發(fā)展,獲得多項(xiàng)專利并得到業(yè)內(nèi)廣泛認(rèn)同,不斷鞏固著極限元在人工智能領(lǐng)域的領(lǐng)先地位:
一、智能語音平臺(tái) 為行業(yè)用戶提供深度語言定制化解決方案
極限元智能語音平臺(tái)圍繞自身的語音平臺(tái)優(yōu)勢(shì),為開發(fā)者提供多種API接口,系統(tǒng)集成商、解決方案提供商、軟件開發(fā)商等合作伙伴可通過標(biāo)準(zhǔn)接口方便快捷地將極限元智能語音平臺(tái)能力集成到各種應(yīng)用系統(tǒng)中,方便開發(fā)者輕松快速構(gòu)建有聲世界。讓語音技術(shù)在生活、醫(yī)療、教育、家居、安防、金融、互聯(lián)網(wǎng)等行業(yè)得到更多應(yīng)用,這些應(yīng)用每日為數(shù)以百萬計(jì)的移動(dòng)互聯(lián)網(wǎng)用戶提供流暢的語音服務(wù)。
同時(shí),語音平臺(tái)支持大詞匯量連續(xù)語音在線識(shí)別,在云計(jì)算平臺(tái)下,借助深度學(xué)習(xí)方法DNN和自然語言處理使識(shí)別準(zhǔn)確率可達(dá)99%以上,而識(shí)別延時(shí)僅為0.1倍時(shí)長。
在聲紋識(shí)別方面,99%以上的超高識(shí)別準(zhǔn)確率確保安全,其場(chǎng)景是提取說話人的語音身份特征進(jìn)行身份驗(yàn)證,主要應(yīng)用于安防??焖俦憬莸淖?cè)算法,高速識(shí)別保證效率、深度的語義理解、特定場(chǎng)景的語義解析技術(shù),融合依存句法分析、信息抽取,將安全和便捷省時(shí)完美結(jié)合統(tǒng)一。
智能語音平臺(tái)在教育方面的應(yīng)用就更廣泛了,極限元為語文出版社定制的口語評(píng)測(cè)功能,參考標(biāo)準(zhǔn)示范發(fā)音,對(duì)口語發(fā)音的效果進(jìn)行客觀評(píng)測(cè)。其支持音素、字詞、語句、段落等多個(gè)維度的測(cè)評(píng),包括準(zhǔn)確度、流利度、節(jié)奏、韻律、語流等多項(xiàng)指標(biāo)都可進(jìn)行技術(shù)統(tǒng)計(jì),在普通話、方言、英語、中文古詩詞等多語種都可進(jìn)行學(xué)習(xí)評(píng)測(cè)。
車浩表示:”目前極限元智能語音平臺(tái)有上萬的用戶規(guī)模,處于培養(yǎng)用戶使用習(xí)慣的階段,不斷提升極限元智能語音平臺(tái)系列產(chǎn)品性能,更在加快研制智能語音芯片,力爭(zhēng)為客戶提供一站式服務(wù),將便捷化、個(gè)性化的服務(wù)推向極致。“
二、互聯(lián)網(wǎng)音、視頻有害信息審查安全網(wǎng)關(guān)
極限元開發(fā)了國內(nèi)首次結(jié)合語音和視頻兩個(gè)維度的安全網(wǎng)關(guān)。雙管齊下的力度,保證了審查的準(zhǔn)確率和效率,也是對(duì)客戶安全需求和成本雙重考慮。
1、大數(shù)據(jù)與深度學(xué)習(xí)相結(jié)合:極限元擁有大數(shù)據(jù)樣本集合,前期的圖像樣本采集工作扎實(shí)到位,數(shù)千萬張的大數(shù)據(jù)樣本,讓有害信息無所遁形。圖像識(shí)別領(lǐng)域最新的卷積神經(jīng)網(wǎng)絡(luò)和長短時(shí)記憶模型相結(jié)合的深度學(xué)習(xí)框架、GPU與CUDA相結(jié)合的訓(xùn)練與識(shí)別框架,讓錯(cuò)判率和漏判率大幅降低。
2、圖形+語音雙深度學(xué)習(xí)檢測(cè)引擎技術(shù):采用共享式網(wǎng)絡(luò)結(jié)構(gòu),多個(gè)神經(jīng)網(wǎng)絡(luò)共享,加強(qiáng)語音與圖像的深度學(xué)習(xí)極大提高檢測(cè)效率。在語音識(shí)別技術(shù)上運(yùn)用馬爾可夫統(tǒng)計(jì)模型,該模型是實(shí)現(xiàn)快速精確的語音識(shí)別系統(tǒng)的最成功的方法,基于馬爾可夫模型的檢測(cè)機(jī)制大幅降低誤報(bào)率。
3、智能化監(jiān)控?cái)?shù)據(jù)抓取機(jī)制:全自動(dòng)智能化監(jiān)控?cái)?shù)據(jù)抓取機(jī)制,網(wǎng)絡(luò)底層部署自動(dòng)數(shù)據(jù)獲取模塊無需用戶再推送,免去客戶二次開發(fā)煩惱。監(jiān)測(cè)數(shù)據(jù)根據(jù)報(bào)警等級(jí)自動(dòng)調(diào)節(jié)信息獲取頻率,在節(jié)省帶寬的同時(shí)保證準(zhǔn)確率。
三、車載疲勞駕駛檢測(cè)儀
智能交通是未來交通系統(tǒng)的發(fā)展方向,如何避免交通事故的發(fā)生、提高車輛的運(yùn)行安全,是智能交通系統(tǒng)亟待解決的問題。目前,由于疲勞駕駛引起的交通事故在全國所有交通事故中占據(jù)很大的比例,因此,研究有效、可行的疲勞駕駛檢測(cè)系統(tǒng)尤為重要。
極限元提出一種面向智能交通的疲勞駕駛檢測(cè)系統(tǒng)解決方案,采集超過50萬名司機(jī)的大數(shù)據(jù),基于面部特征對(duì)車內(nèi)駕駛員的面部疲勞狀態(tài)進(jìn)行監(jiān)控,根據(jù)人眼及其嘴部狀態(tài)判斷駕駛員是否疲勞。
對(duì)于車內(nèi)監(jiān)控區(qū)域視頻,采用直方圖均衡化濾除光照強(qiáng)度變化帶來的影響,利用基于Viola-Jones提出的人臉檢測(cè)算法離線訓(xùn)練的人臉模型對(duì)人臉進(jìn)行粗略檢測(cè),定位出多個(gè)近似于人臉的區(qū)域,并提取區(qū)域的hog特征,然后采用線性svm算法對(duì)上述特征進(jìn)行分類,最終準(zhǔn)確定位人臉位置?;诤撕瘮?shù)相關(guān)濾波算法對(duì)當(dāng)前幀人臉rect進(jìn)行有效追蹤;隨機(jī)梯度下降算法提取人臉面部特征,將人眼連續(xù)多幀閉合,或者嘴部連續(xù)多幀張開等狀態(tài)作為判斷是否疲勞駕駛的依據(jù),覆蓋絕大部分疲勞駕駛場(chǎng)景。
人工智能作為計(jì)算機(jī)領(lǐng)域的概念已經(jīng)發(fā)展了六十余年,從近幾年開始它慢慢從實(shí)驗(yàn)室爬出來,在方方面面滲透我們的生活。在未來幾年,我們應(yīng)該可以看到更多的實(shí)例化的人工智能產(chǎn)品和創(chuàng)業(yè)公司涌現(xiàn)出來。