自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

自適應(yīng)計(jì)算如何解決人工智能產(chǎn)品化的挑戰(zhàn)

人工智能
人工智能技術(shù)如今發(fā)展迅速,創(chuàng)新步伐不斷加快。盡管軟件行業(yè)已經(jīng)成功地部署了人工智能,但是就人工智能的產(chǎn)品化來(lái)說(shuō),包括汽車、工業(yè)、智能零售在內(nèi)的硬件行業(yè)仍處于起步階段。

[[389356]]

人工智能技術(shù)如今發(fā)展迅速,創(chuàng)新步伐不斷加快。盡管軟件行業(yè)已經(jīng)成功地部署了人工智能,但是就人工智能的產(chǎn)品化來(lái)說(shuō),包括汽車、工業(yè)、智能零售在內(nèi)的硬件行業(yè)仍處于起步階段。仍然存在很大差距,并阻礙了人工智能算法概念驗(yàn)證(PoC)成為真正的硬件部署。這些缺陷主要是由于數(shù)據(jù)量小、“不完美”輸入數(shù)據(jù),以及不斷變化的最新技術(shù)模型所致。軟件開(kāi)發(fā)人員和人工智能科學(xué)家如何克服這些挑戰(zhàn)?答案在于采用適應(yīng)性更強(qiáng)的硬件。

數(shù)據(jù)量小

諸如谷歌和Facebook這樣的互聯(lián)網(wǎng)巨頭每天都定期收集和分析大量數(shù)據(jù)。他們使用這些數(shù)據(jù)來(lái)創(chuàng)建具有可接受性能的人工智能模型。在這種情況下,用于訓(xùn)練模型的硬件與用于運(yùn)行模型的硬件有著很大的區(qū)別。

另一方面,在硬件行業(yè)中,大數(shù)據(jù)的可用性受到更多限制,導(dǎo)致成熟的人工智能模型并不成熟。因此,組織需要收集更多數(shù)據(jù)并運(yùn)行在線模型,其中在部署的硬件上進(jìn)行訓(xùn)練和推理,以不斷提高準(zhǔn)確性。

為了解決這個(gè)問(wèn)題,例如經(jīng)過(guò)驗(yàn)證的現(xiàn)場(chǎng)可編程門陣列(FPGA)和自適應(yīng)片上系統(tǒng)(SoC)設(shè)備的自適應(yīng)計(jì)算可以運(yùn)行推理和訓(xùn)練,以不斷地更新新捕獲的數(shù)據(jù)。傳統(tǒng)的人工智能訓(xùn)練需要在云平臺(tái)或大型數(shù)據(jù)中心進(jìn)行,并且需要花費(fèi)數(shù)天甚至數(shù)周的時(shí)間才能完成。另一方面,實(shí)際數(shù)據(jù)主要在邊緣生成。在同一邊緣設(shè)備上運(yùn)行人工智能推理和訓(xùn)練,不僅可以降低總體擁有成本(TCO),而且可以減少延遲和安全隱患。

“不完美”輸入

以X射線圖像為例,采用人工智能模型概念驗(yàn)證(PoC)來(lái)更精確檢測(cè)冠狀病毒變得越來(lái)越容易,但這些概念驗(yàn)證(PoC)幾乎總是基于經(jīng)過(guò)良好處理的輸入圖片和信息。在現(xiàn)實(shí)生活中,來(lái)自醫(yī)療設(shè)備、機(jī)器人和移動(dòng)汽車的攝像頭和傳感器輸入會(huì)產(chǎn)生隨機(jī)失真,例如更暗圖像和角度不當(dāng)?shù)奈矬w。這些輸入數(shù)據(jù)首先需要經(jīng)過(guò)復(fù)雜的預(yù)處理來(lái)清理和重新格式化,然后才能輸入到人工智能模型中。預(yù)處理對(duì)于理解人工智能模型的輸出和計(jì)算正確的決策非常重要。

確實(shí),某些芯片可能非常擅長(zhǎng)人工智能推理加速,但是它們幾乎只是加速某一部分應(yīng)用程序。以智能零售行業(yè)為例,預(yù)處理包括多流視頻解碼,然后采用常規(guī)的計(jì)算機(jī)視覺(jué)算法,對(duì)視頻進(jìn)行調(diào)整大小、變形和格式化。預(yù)處理還包括對(duì)象跟蹤和數(shù)據(jù)庫(kù)查找。最終客戶不太在乎人工智能推理的運(yùn)行速度,而是在乎是否能夠滿足整個(gè)應(yīng)用程序管道的視頻流性能和/或?qū)崟r(shí)響應(yīng)能力。FPGA和自適應(yīng)概念驗(yàn)證(PoC)具有使用特定領(lǐng)域架構(gòu)(DSA)加速這些預(yù)處理的良好記錄。另外,添加人工智能推理概念驗(yàn)證(PoC)將使整個(gè)系統(tǒng)得以優(yōu)化,以滿足端到端的產(chǎn)品需求。

不斷變化的“最新技術(shù)”模型

人工智能研究社區(qū)如今越來(lái)越活躍,世界各地的研究人員每天都在開(kāi)發(fā)新的人工智能模型。這些模型提高了準(zhǔn)確性,減少了計(jì)算需求,并處理新型的人工智能應(yīng)用程序。這些快速的創(chuàng)新為現(xiàn)有的半導(dǎo)體硬件設(shè)備帶來(lái)了壓力,需要更新的架構(gòu)來(lái)有效地支持現(xiàn)代算法。MLPerf等標(biāo)準(zhǔn)基準(zhǔn)測(cè)試證明,在運(yùn)行實(shí)際的人工智能工作負(fù)載時(shí),最先進(jìn)的CPU、GPU和人工智能 ASIC芯片的性能低于廠商宣稱的性能的30%。這種情況一直在推動(dòng)對(duì)特定領(lǐng)域架構(gòu)(DSA)新的需求,以跟上創(chuàng)新的步伐。

最近一些趨勢(shì)推動(dòng)了對(duì)新的特定領(lǐng)域架構(gòu)(DSA)的需求。深度卷積是一個(gè)新興的層,需要更大的內(nèi)存帶寬和特殊的內(nèi)存緩存才能有效。典型的人工智能芯片和GPU具有固定的L1/L2/L3緩存架構(gòu),并且內(nèi)部?jī)?nèi)存帶寬有限,導(dǎo)致效率非常低。

研究人員正在不斷開(kāi)發(fā)新的自定義層,而如今的芯片本身并不能支持這些新的自定義層。因此,它們需要在沒(méi)有加速的情況下在服務(wù)器的CPU上運(yùn)行,這常常成為性能瓶頸。

稀疏神經(jīng)網(wǎng)絡(luò)是另一種很有前途的優(yōu)化方法,它通過(guò)修剪網(wǎng)絡(luò)邊緣、去除卷積中的細(xì)粒度矩陣值等方法對(duì)網(wǎng)絡(luò)進(jìn)行大量修剪,有時(shí)修剪率高達(dá)99%。然而,要在硬件中高效運(yùn)行,需要專門的稀疏架構(gòu),大多數(shù)芯片根本沒(méi)有用于這些操作的編碼器和解碼器。

二進(jìn)制/三進(jìn)制是極限的優(yōu)化,可以將所有數(shù)學(xué)運(yùn)算轉(zhuǎn)換為位運(yùn)算。大多數(shù)人工智能芯片和GPU僅具有8位、16位或浮點(diǎn)計(jì)算單元,因此通過(guò)執(zhí)行極低的精度將不會(huì)獲得任何性能或功效。FPGA和可適應(yīng)的SoC非常完美,因?yàn)殚_(kāi)發(fā)人員可以開(kāi)發(fā)出完美的DSA,并為工作量非常大的現(xiàn)有設(shè)備進(jìn)行重新編程。作為證明,最新的MLPerf包括Xilinx與Mipsology合作提交的文件,該文件使用ResNet-50標(biāo)準(zhǔn)基準(zhǔn)測(cè)試實(shí)現(xiàn)了100%的硬件數(shù)據(jù)表性能。

沒(méi)有硬件專業(yè)知識(shí)?不要擔(dān)心

從歷史上看,F(xiàn)PGA和自適應(yīng)SoC的最大挑戰(zhàn)是需要硬件專家來(lái)實(shí)施和部署DSA。好消息是,現(xiàn)在有一些工具(例如Vitis統(tǒng)一軟件平臺(tái))支持C ++、Python和流行的人工智能框架(如TensorFlow和PyTorch),從而縮小了軟件和人工智能開(kāi)發(fā)人員的差距。

除了在軟件抽象工具方面進(jìn)行更多開(kāi)發(fā)之外,諸如Vitis硬件加速庫(kù)之類的開(kāi)源庫(kù)也極大地促進(jìn)了開(kāi)發(fā)人員社區(qū)的采用。在最近的設(shè)計(jì)競(jìng)賽中,Xilinx公司吸引了1000多名開(kāi)發(fā)人員參與,并發(fā)布了許多創(chuàng)新項(xiàng)目,從手勢(shì)控制的無(wú)人機(jī)到使用二值神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)。重要的是,提交的大多數(shù)項(xiàng)目都是由以前沒(méi)有FPGA經(jīng)驗(yàn)的軟件和人工智能開(kāi)發(fā)人員提供的。這證明FPGA行業(yè)正在采取正確的措施,使軟件和人工智能開(kāi)發(fā)人員能夠解決現(xiàn)實(shí)世界中人工智能產(chǎn)品化的挑戰(zhàn)。

直到最近,對(duì)于軟件開(kāi)發(fā)人員和人工智能科學(xué)家來(lái)說(shuō),釋放硬件適應(yīng)性的潛力是無(wú)法實(shí)現(xiàn)的。以前需要特定的硬件專業(yè)知識(shí),但是由于有了新的開(kāi)源工具,軟件開(kāi)發(fā)人員現(xiàn)在可以使用適應(yīng)性強(qiáng)的硬件。借助這種新的編程簡(jiǎn)便性,軟件開(kāi)發(fā)人員和人工智能科學(xué)家將更易于使用FPGA和自適應(yīng)SoC,從而使這些設(shè)備成為下一代應(yīng)用程序的首選硬件解決方案。實(shí)際上,DSA將代表人工智能推理的未來(lái),軟件開(kāi)發(fā)人員和人工智能科學(xué)家將利用硬件的適應(yīng)性為其下一代應(yīng)用程序提供支持。

 

責(zé)任編輯:姜華 來(lái)源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2024-01-09 13:34:35

2022-11-04 08:00:00

2023-03-27 11:33:37

人工智能物聯(lián)網(wǎng)

2020-09-14 11:23:48

人工智能

2021-02-10 10:41:04

人工智能數(shù)據(jù)中心AI

2017-04-05 08:14:22

2018-07-22 15:38:18

人工智能AI商業(yè)化

2022-11-09 10:39:27

2021-03-04 13:55:51

人工智能偏見(jiàn)AI

2018-08-02 09:20:27

區(qū)塊鏈人工智能

2021-03-17 14:42:04

人工智能AI

2023-06-07 15:43:54

自動(dòng)化人工智能

2021-03-16 11:07:06

人工智能

2019-02-21 10:02:35

人工智能AI機(jī)器學(xué)習(xí)

2017-04-24 18:39:24

人工智能

2021-06-28 10:00:15

人工智能數(shù)據(jù)中心AI

2015-12-16 13:34:27

斐訊

2023-10-18 14:15:43

人工智能云計(jì)算

2021-12-07 11:14:03

人工智能行為科學(xué)疫苗

2020-09-01 11:17:51

霧計(jì)算物聯(lián)網(wǎng)IOT
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)