自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="hfsah"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

AI開發(fā)者九問：10分鐘了解AI開發(fā)的基本過程

作者：佚名 2021-07-28 08:51:51

AI模型本質(zhì)是一個函數(shù)，想要找到這個函數(shù)準(zhǔn)確的的表達(dá)式，僅憑邏輯是無法推導(dǎo)出來的，而是訓(xùn)練出來的。

1、AI開發(fā)究竟在開發(fā)什么？

一個硬件開發(fā)者的工作成果是一個布滿集成電路的服務(wù)器，開機(jī)就可以運(yùn)行某種軟件。
一個移動端開發(fā)者的工作成果可以是一個手機(jī)APP，包括了大量二進(jìn)制數(shù)據(jù)，可被麒麟芯片直接運(yùn)行。
一個AI開發(fā)者的工作成果則是一個模型，模型本質(zhì)上是一個函數(shù)：

f(圖片) = "How are you" 
f(貓圖片) = "Cat"

無論這個函數(shù)有多么復(fù)雜，有多少個變量或者參數(shù)，AI開發(fā)都是試圖找出這個函數(shù)的表達(dá)式。

2、AI模型（函數(shù)）是怎么開發(fā)出來的？

AI模型本質(zhì)是一個函數(shù)，想要找到這個函數(shù)準(zhǔn)確的的表達(dá)式，僅憑邏輯是無法推導(dǎo)出來的，而是訓(xùn)練出來的，我們喂給機(jī)器目前已有的數(shù)據(jù)，機(jī)器就會從這些數(shù)據(jù)里去找出一個最能滿足（專業(yè)術(shù)語稱為擬合）這些數(shù)據(jù)的函數(shù)，當(dāng)有新的數(shù)據(jù)需要預(yù)測的時候，機(jī)器就可以通過這個函數(shù)去預(yù)測出這個新數(shù)據(jù)對應(yīng)的結(jié)果是什么。

對于一個具備某種智能能力而言，一般具備以下要素：數(shù)據(jù)+算法+模型，開發(fā)的過程，就是不斷地用數(shù)據(jù)和算法使得模型越來越逼近真實情況，注意是逼近而非推導(dǎo)，這個過程稱為訓(xùn)練。

3、AI模型的訓(xùn)練過程是怎么樣的？

我們來用一個能夠區(qū)分貓和狗圖片的模型來幫助理解訓(xùn)練的過程：“數(shù)據(jù)”就是我們需要準(zhǔn)備大量標(biāo)注過是“貓”還是“狗”的圖片；“算法”指的是構(gòu)建模型時我們打算用淺層的網(wǎng)絡(luò)還是深層的，如果是深層的話我們要用多少層，每層有多少神經(jīng)元、功能是什么等等，也就是網(wǎng)絡(luò)架構(gòu)的設(shè)計，相當(dāng)于我們確定了我們的預(yù)測函數(shù)應(yīng)該大致結(jié)構(gòu)是什么樣的。

我們用Y=f(W，X，b)來表示這一函數(shù)，X是已有的用來訓(xùn)練的數(shù)據(jù)（貓和狗的圖片），Y是已有的圖片數(shù)據(jù)的標(biāo)簽（該圖片是貓還是狗）, W和b是什么意思呢？一開始，我們確實不知道，這兩個參數(shù)是需要機(jī)器學(xué)習(xí)后自己找出來的，找的過程也就是訓(xùn)練的過程。

“模型”指的我們把數(shù)據(jù)帶入到算法中進(jìn)行訓(xùn)練，機(jī)器就會去不斷地學(xué)習(xí)，當(dāng)機(jī)器找到最優(yōu)W和b后，我們就說這個模型是訓(xùn)練成功了，這個時候我們的函數(shù)Y=f(W，X，b)就完全確定下來了

然后我們就可以在已有的數(shù)據(jù)集外給模型一張新的貓或狗的圖片，那模型就能通過函數(shù)Y=f(W，X，b)算出來這張圖的標(biāo)簽究竟是貓還是狗，這就是推理。

簡單總結(jié)下：不管是最簡單的線性回歸模型、還是較復(fù)雜的擁有一億個參數(shù)的深度神經(jīng)網(wǎng)絡(luò)模型，本質(zhì)都是尋找一個能夠良好擬合目前已有數(shù)據(jù)的函數(shù)Y=f(W，X，b)，并且我們希望這個函數(shù)在新的未知數(shù)據(jù)上也能夠表現(xiàn)良好。

4、AI為什么要強(qiáng)調(diào)大量數(shù)據(jù)？

因為只有數(shù)據(jù)量足夠大，模型才能夠?qū)W習(xí)到足夠多且準(zhǔn)確的區(qū)分貓和狗的特征，才能在區(qū)分貓狗這個任務(wù)上，表現(xiàn)出足夠高的準(zhǔn)確性；當(dāng)然數(shù)據(jù)量不大的情況下，我們也可以訓(xùn)練模型，不過在新數(shù)據(jù)集上預(yù)測出來的結(jié)果往往就會差很多。

假設(shè)識別貓的模型要非常準(zhǔn)確，就需要各種光照條件、各種背景、各種花色的貓的照片，不僅要有波斯貓，還要有加菲貓，直到模型包含了我們能想到的各種貓的特征，一個人臉識別模型，大約需要幾百萬張照片，才能達(dá)到可用，著名的Imagenet數(shù)據(jù)集，大約包含了1400萬張圖片，極大地方便了開發(fā)者。

5、在AI開發(fā)過程中一個好的開發(fā)工具可以幫助開發(fā)者做什么？

假設(shè)沒有一個現(xiàn)成的開發(fā)平臺，首先你需要學(xué)會常用的AI開發(fā)語言python，python是整個過程并不耗精力的環(huán)節(jié)，其次你需要學(xué)習(xí)傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相關(guān)算法，這塊算是花費(fèi)最多精力和時間的環(huán)節(jié)，然后盡可能去理解和推導(dǎo)算法，然后用python代碼去實現(xiàn)算法再訓(xùn)練模型，代碼能力很重要，不然你的模型都建不起來。

然后你發(fā)現(xiàn)了一個開發(fā)框架，華為MindSpore或者谷歌Tensorflow，你會發(fā)現(xiàn)并不需要那么高的數(shù)學(xué)門檻，不是說要深刻理解算法才能更好訓(xùn)練出好模型，模型損失函數(shù)優(yōu)化方法MindSpore/Tensorflow都內(nèi)置好了，而且只需要簡單的調(diào)用就好了，如果說MindSpore/Tensorflow是可以把一個模型代碼量大大減少的框架，那么Keras就是讓模型代碼量可以少到驚人的框架，例如上面的貓狗分類器，15行代碼就可以搞定，幾十行代碼就把一個擁有著卷積層、池化層和全連接層的較高級優(yōu)化方法的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)寫出來。

一個開發(fā)框架就像安卓框架為手機(jī)APP開發(fā)者提供的很多基礎(chǔ)功能，如果沒有這個框架，一個簡單的給好友發(fā)送圖片的功能，你需要直接和操作系統(tǒng)的各個底層功能模塊打交道了。

6、AI開發(fā)，有了開發(fā)框架就夠了嗎？

當(dāng)然不是，一個開發(fā)框架，只是幫開發(fā)者做了一些開發(fā)者沒必要實現(xiàn)的部分，或者實現(xiàn)起來代價太大的部分，一個完整的AI開發(fā)過程，從準(zhǔn)備數(shù)據(jù)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、選擇算法、訓(xùn)練、調(diào)參、部署，這和一個普通的APP開發(fā)的過程差不多。如同生產(chǎn)一輛汽車，一個自動化、高科技的總裝車間是必不可少的，但沖壓、涂裝車間也制約著汽車的生產(chǎn)效率，那么制約AI開發(fā)效率最頭痛的是什么，請看下一個問題。AI開發(fā)過程中最大的困難是什么？

7、AI開發(fā)過程中最大的困難是什么？

要準(zhǔn)備大量的數(shù)據(jù)，前面已經(jīng)提過，更可怕的是數(shù)據(jù)標(biāo)注，據(jù)統(tǒng)計，數(shù)據(jù)處理和標(biāo)注環(huán)節(jié)大約占整個開發(fā)周期的70%。所謂標(biāo)注，就是給數(shù)據(jù)打標(biāo)簽，告訴機(jī)器一張圖片究竟是貓還是狗，標(biāo)注是一件在AI開發(fā)者看來技術(shù)含量非常低的工作，已經(jīng)屬于勞動密集型產(chǎn)業(yè)，業(yè)界有大量的第三方公司，專門從事數(shù)據(jù)標(biāo)注工作。以自動駕駛為例，車頭上的攝像機(jī)在實時拍攝車前的所有畫面，自動駕駛標(biāo)注的過程要標(biāo)注前車、障礙物、行人、信號燈、指示牌、指示線等等，這個過程如果完全依賴人工標(biāo)注，自動駕駛將永遠(yuǎn)難以商用。
要反復(fù)迭代訓(xùn)練，訓(xùn)練并不是一蹴而就，要反復(fù)修改各種參數(shù)，使得模型的準(zhǔn)確度逐步提升，這個過程，目前需要豐富的經(jīng)驗，如果沒有充足的算力，訓(xùn)練一次，等待三天，然后調(diào)參，再等待三天，如果要迭代20次，這個過程是很消耗人的意志。所以，即使不考慮成本因素，算力也是制約AI普及最大的問題。

8、怎么解決AI開發(fā)者的問題？

正如開發(fā)一個office軟件，不可能費(fèi)事到用記事本敲代碼，你需要一個像visual studio一樣的集成開發(fā)環(huán)境，需要一個像Git一樣的代碼管理工具，同理，開發(fā)一個AI模型，你也需要一個集成開發(fā)環(huán)境，而且需要一個版本管理工具。

提供給開發(fā)者代碼編輯環(huán)境、語法檢查、編譯器等功能，一個AI的開發(fā)平臺，同樣也要能幫開發(fā)者標(biāo)注數(shù)據(jù)、創(chuàng)建模型訓(xùn)練作業(yè)、部署模型等功能，有了開發(fā)平臺，開發(fā)平臺要幫助開發(fā)者把所有苦活累活都干完，讓開發(fā)者聚焦在最核心的代碼和算法上。

當(dāng)然，要提供給開發(fā)者易獲取、性能強(qiáng)、價格低的算力，提高模型訓(xùn)練的迭代速度。

9、有沒有更快地提升AI開發(fā)速度的辦法？

當(dāng)然有。從根本上提升開發(fā)效率，挖掘到最本質(zhì)，只有兩個辦法：重用和自動化，否則只能一行一行代碼干起。

開發(fā)一個APP，可以從最基本的代碼寫起，可以復(fù)用開發(fā)者共享的開發(fā)包、函數(shù)等，華為云開源鏡像站有大量的java開發(fā)包，就是這個意思，也可以復(fù)用一個完整的APP，修改下界面配色，就變成了自己的APP，這是復(fù)用。要保障APP的質(zhì)量，可以手工測試，也可以用自動化測試工具。如果這些都不想做，可以也可以用一個現(xiàn)成的工具，用可視化的方法生成一個APP，當(dāng)然APP的風(fēng)格只能從工具已有的模板中選取。開發(fā)者一直在試圖用各種辦法，降低開發(fā)的工作量。

AI開發(fā)也是一樣的?？梢哉椰F(xiàn)成的數(shù)據(jù)集、找現(xiàn)成的標(biāo)注好的數(shù)據(jù)集，現(xiàn)成的算法和模型，用自動部署工具將模型部署到端邊云。當(dāng)然，也可用自動學(xué)習(xí)功能，只要提供原始數(shù)據(jù)，由系統(tǒng)幫助開發(fā)者完成模型構(gòu)建、算法選擇和自動訓(xùn)練，開發(fā)者可以直接看到結(jié)果。最簡單的辦法，就是尋找一個已經(jīng)訓(xùn)練好的模型，在軟件中直接調(diào)用。

基于此，一個好的AI開發(fā)平臺，要從各個維度去提升開發(fā)效率，這些功能往往都是很多小細(xì)節(jié)，算力強(qiáng)、訓(xùn)練快，只是完成了必須的最基本的功能。

責(zé)任編輯：張燕妮來源：博客園精華區(qū)

AI 數(shù)據(jù)人工智能

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="1v7l3"></style>