企業(yè)界遲遲未采用深度學(xué)習(xí)的四大原因
譯文【51CTO.com快譯】在過(guò)去的幾年里,許多公司獲得了采用數(shù)據(jù)驅(qū)動(dòng)型方法帶來(lái)的好處。數(shù)據(jù)2.0戰(zhàn)略將由新的人工智能技術(shù)驅(qū)動(dòng),比如深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和貝葉斯機(jī)器學(xué)習(xí)。
深度學(xué)習(xí)是***進(jìn)的人工智能方法,涉及機(jī)器翻譯、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理。不使用這些技術(shù)會(huì)影響收入,并限制最終用戶的體驗(yàn)。
使用深度學(xué)習(xí)的方法可全面解決問(wèn)題。換句話說(shuō),我們讓算法而不是人類來(lái)決定什么是解決問(wèn)題的要點(diǎn)。這種方法簡(jiǎn)化了系統(tǒng),并讓數(shù)據(jù)可以做決策。更重要的是,它***限度地減小了人類帶來(lái)自身偏見(jiàn)的可能性。
1. 深度學(xué)習(xí)很深?yuàn)W,要招聘合適的人員。
深度學(xué)習(xí)是人工智能這個(gè)更廣泛的領(lǐng)域的分支。
深度學(xué)習(xí)是個(gè)龐大的研究領(lǐng)域。如今許多公司使用的機(jī)器學(xué)習(xí)大多可能基于廣為人知、較為悠久的算法,這些算法可使用scikit-learn之類的開(kāi)源工具輕松構(gòu)建。然而,深度學(xué)習(xí)還沒(méi)有達(dá)到那么成熟的地步。谷歌員工François Chollet開(kāi)發(fā)的Keras、Facebook的PyTorch和谷歌開(kāi)發(fā)的Tensorflow,諸如此類的工具已讓深度學(xué)習(xí)更普及開(kāi)來(lái)。
雖然讓簡(jiǎn)單的深度學(xué)習(xí)例子切實(shí)有用比較容易,但改變行業(yè)規(guī)則的重大結(jié)果卻需要我們所說(shuō)的“魔法”。深度學(xué)習(xí)的秘訣在于,***進(jìn)的結(jié)果需要大量的計(jì)算資源、深入了解訓(xùn)練技巧以及特別熟悉某種特定的方法。
解決辦法:招聘構(gòu)建過(guò)深度學(xué)習(xí)系統(tǒng),而不是只會(huì)復(fù)制粘貼的研究人員。這些人不需要都有博士學(xué)位,一些***的機(jī)器學(xué)習(xí)研究人員連大學(xué)學(xué)位都沒(méi)有。
2. 可解釋性重要嗎?
深度學(xué)習(xí)中的可解釋性是指明白為什么系統(tǒng)做出某個(gè)決策。這是人工智能界的一個(gè)熱門話題,具體歸結(jié)為企業(yè)的使用場(chǎng)景和風(fēng)險(xiǎn)容忍度。對(duì)于制藥公司來(lái)說(shuō),明白算法為什么做出可影響我們生活的決策是個(gè)好想法。對(duì)于客戶流失預(yù)測(cè)來(lái)說(shuō),如果系統(tǒng)能大大降低流失率,可解釋性可能不是很重要。
正如Facebook的人工智能研究主任Yann LeCun在《人工智能大辯論》中所說(shuō):“如果你向一家公司展示兩個(gè)系統(tǒng),一個(gè)是表現(xiàn)還行的可解釋的簡(jiǎn)單系統(tǒng),另一個(gè)是表現(xiàn)更好的較復(fù)雜系統(tǒng),公司每次都會(huì)選擇后者,每次都是如此。”
我在自己的工作和研究中經(jīng)常聽(tīng)到的就是所謂的“黑盒子謬誤”(black box fallacy)。數(shù)據(jù)科學(xué)家常常將神經(jīng)網(wǎng)絡(luò)稱為無(wú)法理解的黑盒子。雖然解釋結(jié)果不如更傳統(tǒng)的方法那么清楚,但是我們開(kāi)發(fā)出了許多方法來(lái)探究這些網(wǎng)絡(luò)的內(nèi)部。這應(yīng)該不會(huì)阻止公司采用深度學(xué)習(xí)。
解決辦法:確定可解釋性在貴公司帶來(lái)的實(shí)際影響。另外構(gòu)建簡(jiǎn)單的模型,以便有一個(gè)基準(zhǔn)。如果你的深度學(xué)習(xí)方法好得多,它可能會(huì)提供更引人入勝的商業(yè)理由。
3. 你需要更多的數(shù)據(jù)和GPU。
數(shù)據(jù)和計(jì)算能力是當(dāng)今深度學(xué)習(xí)切實(shí)可行的兩大原因。GPU將計(jì)算時(shí)間從幾星期縮短到幾小時(shí)。TPU的速度更快。要是沒(méi)有這些GPU,你不可能足夠快地訓(xùn)練這些模型、獲得顯著成效。貴公司可以自行購(gòu)買GPU,也可以向亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)或谷歌云等提供商租用。
深度學(xué)習(xí)方法需要大量數(shù)據(jù)才能發(fā)現(xiàn)不太明顯的模式。如果沒(méi)有足夠的數(shù)據(jù),這些系統(tǒng)注定會(huì)失敗,或者給人以一種性能良好的假象(即:過(guò)度擬合)。
解決辦法:收集你所有產(chǎn)品的原始信號(hào)。別害怕在GPU上花錢。
4. 人工智能戰(zhàn)略的目標(biāo)不夠遠(yuǎn)大
為什么深度學(xué)習(xí)因大數(shù)據(jù)而變得更有意義?
手動(dòng)特征工程是指人類選擇對(duì)算法來(lái)說(shuō)很重要的東西。由于這個(gè)環(huán)節(jié)牽涉人類,這些系統(tǒng)的性能受制于人類的創(chuàng)造力。一種更好的方法是,使用來(lái)自貝葉斯機(jī)器學(xué)習(xí)的技術(shù)將人類的直覺(jué)添加到系統(tǒng)中。
數(shù)據(jù)科學(xué)團(tuán)隊(duì)認(rèn)為深度學(xué)習(xí)對(duì)于大多數(shù)問(wèn)題而言大材小用。雖然神經(jīng)網(wǎng)絡(luò)無(wú)法解決所有問(wèn)題,但它們是***進(jìn)的方法,涉及計(jì)算機(jī)視覺(jué)、音頻和自然語(yǔ)言處理。這種思維人為地限制了系統(tǒng)的性能。如果你知道汽車比馬快,為什么還要繼續(xù)騎馬?
解決辦法:使用較悠久的機(jī)器學(xué)習(xí)方法構(gòu)建強(qiáng)大的基準(zhǔn)。如果深度學(xué)習(xí)能超過(guò)這個(gè)基準(zhǔn),就使用深度學(xué)習(xí)。這讓你得以量化這些技術(shù)相對(duì)于更簡(jiǎn)單的方法所提供的價(jià)值。
結(jié)束語(yǔ)
深度學(xué)習(xí)已離開(kāi)了學(xué)術(shù)界,準(zhǔn)備改變公司企業(yè)。別害怕負(fù)責(zé)任地使用深度學(xué)習(xí)。不正確的采用會(huì)導(dǎo)致數(shù)據(jù)出現(xiàn)偏差,因而會(huì)損害貴公司和最終用戶。深度學(xué)習(xí)有助于將人類從機(jī)器學(xué)習(xí)這條環(huán)中解放出來(lái),***限度地減小系統(tǒng)出現(xiàn)偏差的可能性。構(gòu)建任何機(jī)器學(xué)習(xí)系統(tǒng)時(shí),始終恪守倫理道德很重要。
原文標(biāo)題:4 Reasons Why Companies Struggle To Adopt Deep Learning,作者:William Falcon
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】