中科創(chuàng)達(dá)孫力:AI賦能行業(yè)的難點(diǎn)與應(yīng)對(duì)方法
原創(chuàng)【51CTO.com原創(chuàng)稿件】當(dāng)下,人工智能賦能安防、金融等細(xì)分領(lǐng)域,參與關(guān)鍵工作流程,提供多種多樣實(shí)用的服務(wù)。伴隨嵌入式領(lǐng)域的加速演進(jìn),人工智能被廣泛關(guān)注,作用于更多場(chǎng)景。中科創(chuàng)達(dá)立足智能終端操作系統(tǒng),聚焦嵌入式人工智能關(guān)鍵技術(shù)。近日,中科創(chuàng)達(dá)聯(lián)合清華大學(xué)、美國(guó)高通公司共同舉辦了“ThunderWorld2018嵌入式人工智能大會(huì)”,圍繞嵌入式人工智能領(lǐng)域的技術(shù)前沿、產(chǎn)業(yè)趨勢(shì)和熱點(diǎn)問(wèn)題探討。
孫力·中科創(chuàng)達(dá)副總裁
主論壇上,中科創(chuàng)達(dá)副總裁孫力做了主題為《智能視覺(jué)的“深蹲”和“起跑”》的演講,闡述了建設(shè)圖像系統(tǒng)、普及3D圖像技術(shù)、優(yōu)化嵌入式AI算法應(yīng)用及AI賦能行業(yè)的難點(diǎn)與應(yīng)對(duì)方法展開(kāi)。
建設(shè)圖像系統(tǒng)的難點(diǎn)與應(yīng)對(duì)方法
視覺(jué)技術(shù),是一門(mén)涉及諸多領(lǐng)域的交叉學(xué)科,用Camera進(jìn)行圖像抓取是前提。抓取的過(guò)程錯(cuò)綜復(fù)雜,涉及到模組進(jìn)行圖像采集與應(yīng)用、主芯片功耗、性能和系統(tǒng)的優(yōu)化,及人臉識(shí)別、美顏、傳統(tǒng)拼接、光學(xué)處理、降噪等一系列算法。
做一個(gè)優(yōu)秀圖像系統(tǒng)除采集方面挑戰(zhàn),還有圖象處理算法,如曝光,白平衡,對(duì)焦,寬動(dòng)態(tài)HDR,降噪等)、芯片加速、畫(huà)質(zhì)調(diào)優(yōu)等,還有硬件的碎片化須對(duì)畫(huà)質(zhì)進(jìn)行復(fù)雜的調(diào)優(yōu)流程(實(shí)驗(yàn)室和實(shí)際生活場(chǎng)景),還有慮功耗,性能和健壯性也是必須要考慮的。
孫力表示,畫(huà)質(zhì)調(diào)優(yōu)是圖像處理最重要的部分。想要產(chǎn)生***的圖像質(zhì)量,需要調(diào)試整個(gè)圖像的Pipeline、 3A(對(duì)焦,曝光,白平衡)等等很多細(xì)節(jié) 。
IQ – 畫(huà)質(zhì)調(diào)優(yōu)三大階段
畫(huà)質(zhì)調(diào)試,分為三大階段:
1. ***做好基礎(chǔ)軟件、驅(qū)動(dòng),像軟件功能檢查、無(wú)重大Bug影響IQ、驗(yàn)證原始圖片(EXIF、AE參數(shù),校準(zhǔn)數(shù)據(jù))等;
2. 配置相關(guān)專(zhuān)業(yè)設(shè)備,進(jìn)行實(shí)驗(yàn)室調(diào)參,像LSC、AWB、AE、Gamma、對(duì)比度增強(qiáng)、CCM、DPC、濾噪、邊緣增強(qiáng)等參數(shù)檢測(cè)及處理。
3. 真實(shí)場(chǎng)景調(diào)參,與參考設(shè)備對(duì)比拍攝并調(diào)整,參考設(shè)備像人物、寵物、風(fēng)景、肖像、戶外、低光、辦公室、家庭、閃光燈、背光、電影等。
善用硬件加速,解決功耗和性能問(wèn)題
硬件加速是提升圖像計(jì)算的關(guān)鍵部分,使用GPU、CPU等嵌入式硬件都需要具備多方面的能力。嵌入式硬件在對(duì)算法加速上有很大幫助,同時(shí)也會(huì)存在功耗的問(wèn)題,建議類(lèi)汽車(chē)多個(gè)攝像頭的拼接這樣的場(chǎng)景,擇優(yōu)選擇GPU。近幾年,汽車(chē)ADAS芯片對(duì)于高畫(huà)質(zhì)的要求發(fā)生了從外置的ISP到內(nèi)置ISP,到Bayer Sensor的轉(zhuǎn)變, 目前主流的方案是用外置的ISP,將來(lái)汽車(chē)領(lǐng)域也會(huì)經(jīng)歷類(lèi)似于手機(jī)從功能機(jī)到智能機(jī)的演變。主要驅(qū)動(dòng)力有BOM成本降低、如發(fā)熱問(wèn)題,環(huán)視等應(yīng)用的拼接問(wèn)題。像ASIL compatible、長(zhǎng)期投入、Road testing嚴(yán)苛等是汽車(chē)特有的高門(mén)檻。
普及3D圖像技術(shù)的難點(diǎn)與應(yīng)對(duì)方法
利用3D圖像技術(shù)是圖像視覺(jué)方的另一個(gè)趨勢(shì),普及過(guò)程中還需克服以下幾大難題:
- BOM成本,由于規(guī)?;膯?wèn)題,還沒(méi)有降低到平民化。
- 種的光學(xué)設(shè)計(jì),碎片化(ToF,結(jié)構(gòu)光,雙目,主動(dòng)雙目等)。
- 嵌入式的SoC的depth map的運(yùn)算能力(Pc輔助到嵌入式ARM based) 。
- 多套使用的完整建模問(wèn)題。
- RGBD,基于3D的人工智能學(xué)術(shù)進(jìn)展。
孫力表示,中科創(chuàng)達(dá)致力于利用寬動(dòng)態(tài)/HDR 、降噪 、導(dǎo)入AI技術(shù)來(lái)解決傳統(tǒng)圖像質(zhì)量問(wèn)題,經(jīng)過(guò)多年持續(xù)的投入與研發(fā),在視覺(jué)技術(shù)領(lǐng)域已經(jīng)有了很深厚的積累。
優(yōu)化嵌入式AI算法應(yīng)用的難點(diǎn)與應(yīng)對(duì)方法
AI正當(dāng)時(shí),嵌入式/邊緣AI是未來(lái),嵌入式/邊緣端智能視覺(jué)設(shè)備量也在迅速增長(zhǎng)。在此大背景下,中科創(chuàng)達(dá)推出一款基于高通驍龍 845 平臺(tái)的人工智能引擎,TurboX AI Kit。TurboX AI Kit主要特點(diǎn)有三:高性能的嵌入式端側(cè)/邊緣,AI 開(kāi)發(fā)平臺(tái);豐富的嵌入式 AI 開(kāi)發(fā)、分析、優(yōu)化和調(diào)試工具;加速端側(cè) AI 的實(shí)現(xiàn)與普及,助力生態(tài)系統(tǒng)構(gòu)建;
當(dāng)前制約嵌入式AI算法應(yīng)用的主要問(wèn)題有:有限的計(jì)算資源、多樣化的應(yīng)用場(chǎng)景和需求、不成熟的生態(tài)系統(tǒng)、碎片化的終端處理平臺(tái)、性能(準(zhǔn)確率-速度)的平衡/取舍、功耗與成本等。想要應(yīng)對(duì)這些問(wèn)題,就需要在硬件和軟件深度結(jié)合、系統(tǒng)化設(shè)計(jì)等方面深究。
AI賦能行業(yè)的難點(diǎn)與應(yīng)對(duì)方法
當(dāng)AI走出實(shí)驗(yàn)室,賦能某個(gè)行業(yè),將面臨方方面面的挑戰(zhàn)。從客戶角度看,期望看到的是整體解決方案(數(shù)據(jù)獲取,隱私問(wèn)題,訓(xùn)練,生產(chǎn)管理系統(tǒng),私有云 部署,前后端等,而不是純算法)。
客戶在衡量AI技術(shù)的預(yù)算不是根據(jù)AI作為高大上的技術(shù)來(lái)做的,而是根據(jù)生產(chǎn)力提升(用戶體驗(yàn)提升,銷(xiāo)售轉(zhuǎn)換率等),運(yùn)行效率優(yōu)化,及經(jīng)營(yíng)業(yè)績(jī)能承受的預(yù)算能力來(lái)反推的,這和目前昂貴的AI投入成本(人力,服務(wù)器等)是個(gè)矛盾。
當(dāng)行業(yè)客戶的工作流程,部門(mén)職能等還未能?chē)@先進(jìn)生產(chǎn)力來(lái)進(jìn)行部署和優(yōu)化時(shí), 客戶期望一次性投入建設(shè)一個(gè)人工智能平臺(tái),可以一勞永逸的自我訓(xùn)練、升級(jí)和部署,對(duì)比于現(xiàn)在需要定制化的算法,未來(lái)圍繞需要解決的領(lǐng)域問(wèn)題,少數(shù)的人力服務(wù)于算法的流程需要被建立。
那么,如何應(yīng)對(duì)AI賦能行業(yè)遇到的這些難點(diǎn)呢?AI需要一個(gè)平臺(tái)和引擎,而不是僅僅提供一個(gè)算法。舉例,下圖為中科創(chuàng)達(dá)智能視覺(jué)缺陷檢測(cè)方案效果圖。
中科創(chuàng)達(dá)智能視覺(jué)缺陷檢測(cè)方案效果圖
具體操作方式是通過(guò)傳統(tǒng)CV技術(shù)首先將復(fù)雜的背景濾除,讓缺陷在圖片上顯現(xiàn)出來(lái),然后進(jìn)行實(shí)際的分類(lèi)。
未來(lái),將有更多企業(yè)應(yīng)用AI,普及度不斷提升,隨著市場(chǎng)的逐漸擴(kuò)大,應(yīng)用逐漸從特定領(lǐng)域向人們?nèi)粘I钌钊搿kS著智能化趨勢(shì)的不斷凸顯,智能視覺(jué)的應(yīng)用也將會(huì)進(jìn)一步拓展和深化,逐漸向更多新興領(lǐng)域邁進(jìn),在智能機(jī)器人、自動(dòng)駕駛、人臉識(shí)別、安防、醫(yī)療等領(lǐng)域的應(yīng)用將會(huì)越來(lái)越多。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】