自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="tvz0f"><s id="tvz0f"><li id="tvz0f"></li></s></sub>

<style id="tvz0f"></style>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

人工智能應(yīng)用架構(gòu)的思考

作者：李虎 2021-07-02 14:18:44

卷積神經(jīng)網(wǎng)絡(luò)日益增長(zhǎng)的深度和尺寸為深度學(xué)習(xí)在移動(dòng)端的部署帶來了巨大的挑戰(zhàn)，深度學(xué)習(xí)模型壓縮與加速成為了學(xué)術(shù)界和工業(yè)界都重點(diǎn)關(guān)注的研究領(lǐng)域之一。

一、Paddle Lite 和 PaddleSlim

目前在深度學(xué)習(xí)領(lǐng)域分類兩個(gè)派別，一派為學(xué)院派，研究強(qiáng)大、復(fù)雜的模型網(wǎng)絡(luò)和實(shí)驗(yàn)方法，為了追求更高的性能；另一派為工程派，旨在將算法更穩(wěn)定、高效的落地在硬件平臺(tái)上，效率是其追求的目標(biāo)。復(fù)雜的模型固然具有更好的性能，但是高額的存儲(chǔ)空間、計(jì)算資源消耗是使其難以有效的應(yīng)用在各硬件平臺(tái)上的重要原因。所以，卷積神經(jīng)網(wǎng)絡(luò)日益增長(zhǎng)的深度和尺寸為深度學(xué)習(xí)在移動(dòng)端的部署帶來了巨大的挑戰(zhàn)，深度學(xué)習(xí)模型壓縮與加速成為了學(xué)術(shù)界和工業(yè)界都重點(diǎn)關(guān)注的研究領(lǐng)域之一。

1. 端側(cè)推理引擎的背景

隨著深度學(xué)習(xí)的快速發(fā)展、特別是小型網(wǎng)絡(luò)模型的不斷成熟，原本應(yīng)用到云端的深度學(xué)習(xí)推理，就可以放到終端上來做，比如手機(jī)、手表、攝像頭、傳感器、音響，也就是端智能。此外，可用于深度學(xué)習(xí)計(jì)算的硬件也有井噴之勢(shì)，從 Intel 到 Nvidia、ARM、Mali、寒武紀(jì)等等。相比服務(wù)端智能，端智能具有延時(shí)低、節(jié)省資源、保護(hù)數(shù)據(jù)隱私等優(yōu)勢(shì)。目前已經(jīng)在 AI 攝像、視覺特效等場(chǎng)景廣泛應(yīng)用。

然而，深度學(xué)習(xí)推理場(chǎng)景中，多樣的平臺(tái)、不同的芯片對(duì)推理庫(kù)的能力提出了更高的要求。端側(cè)模型的推理經(jīng)常面臨算力和內(nèi)存的限制，加上日趨異構(gòu)化的硬件平臺(tái)和復(fù)雜的端側(cè)使用狀況，導(dǎo)致端側(cè)推理引擎的架構(gòu)能力頗受挑戰(zhàn)。端側(cè)推理引擎是端智能應(yīng)用的核心模塊，需要在有限算力、有限內(nèi)存等限制下，高效地利用資源，快速完成推理。因此，飛槳期望提供面向不同業(yè)務(wù)算法場(chǎng)景、不同訓(xùn)練框架、不同部署環(huán)境，簡(jiǎn)單、高效、安全的端側(cè)推理引擎。

2. Paddlelite 的特色

為了能夠完整地支持眾多的硬件架構(gòu)，實(shí)現(xiàn)在這些硬件之上的各種人工智能應(yīng)用的性能優(yōu)化，飛槳提供端側(cè)推理引擎 Paddle Lite。截止到現(xiàn)在，Paddle Lite 已廣泛應(yīng)用于搜索廣告、手機(jī)百度、百度地圖、全民小視頻等多個(gè)重要業(yè)務(wù)。

Paddle Lite 具備如下產(chǎn)品特色：

1）移動(dòng)端和嵌入端的模型部署工具，可使用其部署 PaddlePaddle、TensorFlow、Caffe、ONNX 等多種平臺(tái)的主流模型格式，包括 MobileNetV1、YoloV3、UNet、SqueezeNet 等主流模型。

2）多種語言的 API 接口：C++/Java/Python，便于嵌入各種業(yè)務(wù)程序。

3）豐富的端側(cè)模型：resnet、effcientnet、shufflenet、mobilenet、unet、facedetection、unet、ocr_attention 等。

4）支持豐富的移動(dòng)和嵌入端芯片：ARM CPU、Mali GPU、Adreno GPU，昇騰 &麒麟 NPU，MTK NeuroPilot，RK NPU，寒武紀(jì) NPU，X86 CPU，NVIDIA GPU，F(xiàn)PGA 等多種硬件平臺(tái)。

5）除了 Lite 本身提供的性能優(yōu)化策略外，還可以結(jié)合 PaddleSlim 可以對(duì)模型進(jìn)行壓縮和量化，以達(dá)到更好的性能。

3. 架構(gòu)設(shè)計(jì)

架構(gòu)圖如上所示，Paddle-Lite 架構(gòu)側(cè)重多硬件、高性能的支持，其主要設(shè)計(jì)思想如下：

1）引入 Type system，強(qiáng)化多硬件、量化方法、data layout 的混合調(diào)度能力。

2）硬件細(xì)節(jié)隔離，通過不同編譯開關(guān)，對(duì)支持的任何硬件可以自由插拔。

3）引入 MIR(Machine IR) 的概念，強(qiáng)化待執(zhí)行環(huán)境下的優(yōu)化支持。

4）圖優(yōu)化模塊和執(zhí)行引擎實(shí)現(xiàn)了良好的解耦拆分，保證預(yù)測(cè)執(zhí)行階段的輕量和高效率。

二、AIOps 的思考

1. 背景

AIOps，最初的定義是 Algorithm IT Operations，是利用運(yùn)維算法來實(shí)現(xiàn)運(yùn)維的自動(dòng)化，最終走向無人化運(yùn)維。隨著技術(shù)成熟，逐步確定為 Artificial Intelligence for IT Operations——智能運(yùn)維，將人工智能應(yīng)用于運(yùn)維領(lǐng)域，基于已有的運(yùn)維數(shù)據(jù)（日志、監(jiān)控信息、應(yīng)用信息等），通過機(jī)器學(xué)習(xí)的方式來進(jìn)一步解決自動(dòng)化運(yùn)維無法解決的問題。

早期的運(yùn)維工作大部分是由運(yùn)維人員手工完成的，手工運(yùn)維在互聯(lián)網(wǎng)業(yè)務(wù)快速擴(kuò)張、人力成本高企的時(shí)代，難以維系。于是，自動(dòng)化運(yùn)維應(yīng)運(yùn)而生，它主要通過可被自動(dòng)觸發(fā)、預(yù)定義規(guī)則的腳本，來執(zhí)行常見、重復(fù)性的運(yùn)維工作，從而減少人力成本，提高運(yùn)維的效率?？偟膩碚f，自動(dòng)化運(yùn)維可以認(rèn)為是一種基于行業(yè)領(lǐng)域知識(shí)和運(yùn)維場(chǎng)景領(lǐng)域知識(shí)的專家系統(tǒng)。隨著整個(gè)互聯(lián)網(wǎng)業(yè)務(wù)急劇膨脹，以及服務(wù)類型的復(fù)雜多樣，“基于人為指定規(guī)則”的專家系統(tǒng)逐漸變得力不從心，自動(dòng)化運(yùn)維的不足，日益凸顯。

DevOps 的出現(xiàn)，部分解決了上述問題，它強(qiáng)調(diào)從價(jià)值交付的全局視角，但 DevOps 更強(qiáng)調(diào)橫向融合及打通，AIOps 則是 DevOps 在運(yùn)維（技術(shù)運(yùn)營(yíng)）側(cè)的高階實(shí)現(xiàn)，兩者并不沖突。AIOps 不依賴于人為指定規(guī)則，主張由機(jī)器學(xué)習(xí)算法自動(dòng)地從海量運(yùn)維數(shù)據(jù)（包括事件本身以及運(yùn)維人員的人工處理日志）中不斷地學(xué)習(xí)，不斷提煉并總結(jié)規(guī)則。AIOps 在自動(dòng)化運(yùn)維的基礎(chǔ)上，增加了一個(gè)基于機(jī)器學(xué)習(xí)的大腦，指揮監(jiān)測(cè)系統(tǒng)采集大腦決策所需的數(shù)據(jù)，做出分析、決策，并指揮自動(dòng)化腳本去執(zhí)行大腦的決策，從而達(dá)到運(yùn)維系統(tǒng)的整體目標(biāo)。

下圖是百度運(yùn)維發(fā)展歷程：

從 2014 年開始，從最開始的行業(yè)領(lǐng)域知識(shí)加上運(yùn)維專家經(jīng)驗(yàn)，到之后加上人工智能算法，演進(jìn)成 AIOps，從數(shù)據(jù)建設(shè)和智能監(jiān)控場(chǎng)景入手，逐漸覆蓋到智能故障管理，變更管理，容量管理和服務(wù)咨詢。

綜上看，自動(dòng)化運(yùn)維水平是 AIOps 的重要基石，而 AIOps 將基于自動(dòng)化運(yùn)維，將 AI 和運(yùn)維很好地結(jié)合起來，這個(gè)過程需要三方面的知識(shí)：

1）行業(yè)、業(yè)務(wù)領(lǐng)域知識(shí)，跟業(yè)務(wù)特點(diǎn)相關(guān)的知識(shí)經(jīng)驗(yàn)積累，熟悉生產(chǎn)實(shí)踐中的難題。

2）運(yùn)維領(lǐng)域知識(shí)，如指標(biāo)監(jiān)控、異常檢測(cè)、故障發(fā)現(xiàn)、故障止損、成本優(yōu)化、容量規(guī)劃和性能調(diào)優(yōu)等。

3）算法、機(jī)器學(xué)習(xí)知識(shí)，把實(shí)際問題轉(zhuǎn)化為算法問題，常用算法包括如聚類、決策樹、卷積神經(jīng)網(wǎng)絡(luò)等。

百度的故障管理場(chǎng)景如圖所示，主要包括故障發(fā)現(xiàn)，故障止損，故障診斷智能預(yù)警等。

2. 故障發(fā)現(xiàn)

運(yùn)維的黃金指標(biāo)有請(qǐng)求數(shù)（流入狀態(tài)），成功率（流出狀態(tài)），響應(yīng)時(shí)間（用戶相應(yīng)感受），系統(tǒng)容量（系統(tǒng)并發(fā)負(fù)載）等。其預(yù)測(cè)難點(diǎn)在于基線預(yù)測(cè)算法在遇到節(jié)假日這種不規(guī)律的情況時(shí)不準(zhǔn)確，另外在于配置上的，忙閑時(shí)間機(jī)器需求差異很大，容易造成資源浪費(fèi)。

2.1 基線預(yù)測(cè)算法

基線預(yù)測(cè)算法主要采用魯棒回歸+周期數(shù)據(jù)多模式挖掘相結(jié)合的算法。魯棒回歸算法的思想是假設(shè)較小窗口內(nèi)符合線性趨勢(shì)變化，即局部符合線性。周期數(shù)據(jù)多模式的思想是對(duì)于不同的節(jié)假日，春節(jié)等特殊時(shí)期采用多種基線模型進(jìn)行匹配。

3. 故障自愈

出現(xiàn)故障第一時(shí)間的原則是故障止損，而不是查明原因，甚至解決問題。先將損失止住，再進(jìn)行分析。

傳統(tǒng)的人工故障止損有以下三個(gè)不足：相應(yīng)可能不夠迅速，決策可能不夠準(zhǔn)確，操作可能出現(xiàn)失誤。AIOps 中的故障止損叫做故障自愈，相對(duì)人工智障止損的不足，它可以 7*24 小時(shí)快速相應(yīng)，全局一致性信息決策，程序自動(dòng)化準(zhǔn)確操作。

故障自愈的場(chǎng)景和止損方法如下：

4. 故障診斷

如下圖所示，為一個(gè)系統(tǒng)的運(yùn)行流圖，G 節(jié)點(diǎn)此時(shí)出現(xiàn)故障。

人工故障針對(duì)的做法通常從兩個(gè)方向出發(fā)，一是找出 A 上的某故障跟 G 節(jié)點(diǎn)的關(guān)系，二是追查 G 節(jié)點(diǎn)異常的原因。這很大程度依賴人工歷史經(jīng)驗(yàn)，不易準(zhǔn)確快速定位原因。AIOps 的智能故障診斷方法的做法是利用黃金指標(biāo)綜合進(jìn)行，做法如下所示：

5. 智能預(yù)警

一個(gè)很重要的運(yùn)維手段就是在故障發(fā)生之前進(jìn)行預(yù)警，從而減少實(shí)際損失。人工的預(yù)警方法通常是根據(jù)經(jīng)驗(yàn)，考慮的指標(biāo)覆蓋范圍小，且閾值的設(shè)置較為困難，容易產(chǎn)生誤報(bào)和漏報(bào)。AIOps 的智能預(yù)警可以覆蓋上萬個(gè)指標(biāo)，且通過機(jī)器學(xué)習(xí)自動(dòng)學(xué)習(xí)到相應(yīng)閾值，而無需人工干預(yù)。智能預(yù)警如下圖所示：

三、快手推薦系統(tǒng) Dragonfly 架構(gòu)啟發(fā)

1. 背景

以推薦系統(tǒng)為例，通常在線推薦系統(tǒng)包括召回，排序，重排三個(gè)模塊。召回是利用如 ANN 檢索，倒排檢索算法，將候選項(xiàng)從千萬降到十萬的數(shù)量級(jí)；排序是利用 CTR，LTR 等指標(biāo)，將候選項(xiàng)從十萬降到千的數(shù)量級(jí)；最后重排是利用多樣性打散，強(qiáng)插，混排技術(shù)將候選項(xiàng)從千降到十的數(shù)量級(jí)。

為了快速?gòu)?fù)用，采用的如上圖的分離的系統(tǒng)架構(gòu)，算法人員和架構(gòu)人員的代碼交織在一起，那幺如何將業(yè)務(wù)代碼和架構(gòu)代碼進(jìn)行解耦呢？David Wheeler 說過，所有的計(jì)算機(jī)問題都可以通過增加一層抽象來解決。

2. 實(shí)現(xiàn)方法

快手架構(gòu)的基本思想是構(gòu)建了一種 DSL 語言 Dragonfly，讓算法人員用類 python 方式開發(fā)，而不用關(guān)注底層的實(shí)現(xiàn)，架構(gòu)人員專注于用 c++實(shí)現(xiàn)底層架構(gòu)。下圖右側(cè)的圖就是一個(gè)算法人員實(shí)現(xiàn)的例子，就是純 python 代碼，容易實(shí)現(xiàn)，易于閱讀。

具體解決方案是將算法都細(xì)分成算子的粒度，如下圖所示，所有的人工智能算法都是由各種算子進(jìn)行組合搭建而成，架構(gòu)人員負(fù)責(zé)開發(fā)這些算子的實(shí)現(xiàn)，算法人員在封裝好的算子基礎(chǔ)上進(jìn)行運(yùn)用。因此算法人員不關(guān)注底層實(shí)現(xiàn)，專心關(guān)注與上層邏輯，去編寫 DSL 語言，然后提交配置即可；架構(gòu)人員不關(guān)注上層邏輯，只負(fù)責(zé)編寫底層算子。

在實(shí)現(xiàn)這種改進(jìn)之后，最大的優(yōu)點(diǎn)就是新場(chǎng)景的接入成本從 7 人日縮減到 1 人日。這種利用算子話粒度解耦的思想是我們是可以借鑒的，我們?cè)谧鏊惴ㄩ_發(fā)時(shí)，很多代碼都交織在一起，不能抽取出來，導(dǎo)致很多重復(fù)性的工作。如果把這些算法進(jìn)行一步步的切分，分成很小的算子粒度，就能夠方便進(jìn)行解耦，是的算法人員可以任意組合拼接算子，實(shí)現(xiàn)業(yè)務(wù)算法。

參考文獻(xiàn)：

[1]《Paddle Lite 端側(cè)部署》作者：吳建明

https://www.cnblogs.com/wujianming-110117/p/14398502.html

[2]《架構(gòu)設(shè)計(jì)》Paddle-Lite

https://paddlepaddle.github.io/Paddle-Lite/v2.2.0/architecture/

[3]《故障管理場(chǎng)景 AIOps 實(shí)踐與探索》作者：陳云

https://ppt.infoq.cn/slide/show?cid=83&pid=3355

[4]《Dragonfly 快手通用策略 DSL 在推薦系統(tǒng)架構(gòu)的應(yīng)用和演進(jìn)》作者：方劍冰

https://ppt.infoq.cn/slide/show?cid=83&pid=3295

[5]《百度飛漿輕量化推理引擎 Paddle Lite 的實(shí)現(xiàn)和應(yīng)用》作者：嚴(yán)春偉

https://ppt.infoq.cn/slide/show?cid=83&pid=3273

責(zé)任編輯：張燕妮來源：金科優(yōu)源匯

人工智能架構(gòu)技術(shù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="bppmt"></sub>

<blockquote id="bppmt"><i id="bppmt"><video id="bppmt"></video></i></blockquote>

<sup id="bppmt"></sup>

<cite id="bppmt"></cite>