如何區(qū)分人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)?
本文內(nèi)容來自于硅谷投資人Lake Dai,LDV Partners合伙人。嚴(yán)肅編輯整理。
人工智能(Artificial Intelligence)是一個最廣泛的概念,人工智能的目的就是讓計算機(jī)這臺機(jī)器能夠象人一樣思考,而機(jī)器學(xué)習(xí)(Machine Learning)是人工智能的分支,專門研究計算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,使之不斷改善自身的性能。
深度學(xué)習(xí)(Deep Learning)是一種機(jī)器學(xué)習(xí)的方法,它試圖使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)成的多個處理層(神經(jīng)網(wǎng)絡(luò))對數(shù)據(jù)進(jìn)行高層抽象的算法。
神經(jīng)網(wǎng)絡(luò)是一組大致模仿人類大腦構(gòu)造設(shè)計的算法,用于識別模式。神經(jīng)網(wǎng)絡(luò)通過機(jī)器感知系統(tǒng)解釋傳感器數(shù)據(jù),能夠?qū)υ驾斎脒M(jìn)行標(biāo)記或聚類等操作。神經(jīng)網(wǎng)絡(luò)所能識別的模式是數(shù)值形式,因此圖像、聲音、文本、時間序列等一切現(xiàn)實世界的數(shù)據(jù)必須轉(zhuǎn)換為數(shù)值。
在深度學(xué)習(xí)網(wǎng)絡(luò)中,每一個節(jié)點(diǎn)層在前一層輸出的基礎(chǔ)上學(xué)習(xí)識別一組特定的特征。隨著神經(jīng)網(wǎng)絡(luò)深度增加,節(jié)點(diǎn)所能識別的特征也就越來越復(fù)雜,因為每一層會整合并重組前一層的特征。
(http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)
上圖顯示了一個神經(jīng)網(wǎng)絡(luò)用于判定一個圖片是不是一條狗的過程,輸入是圖片,通過深層神經(jīng)網(wǎng)絡(luò)對狗的低層特征進(jìn)行抽象,***輸出是圖片是狗的概率。
深度學(xué)習(xí)的過程同樣是分為訓(xùn)練和推理(既“評估”)兩個過程,通過訓(xùn)練過程來獲得數(shù)據(jù)模型,然后用于評估新的數(shù)據(jù)。
數(shù)據(jù)模型分為兩種,一種是所謂判別模型(Discriminative Model),也就是說模型可以直接用來判別事物的。這里所說的判別事物,最典型的就是做分類。既然直接可以用來分類,也就是說我們可以在已知屬性的條件下,對該記錄進(jìn)行判斷。所以,判別模型是對條件概率進(jìn)行的建模,也就是p(Y|X)。這里X就是屬性集合,實際上就是一個向量;而Y則可能是一個值(此時對應(yīng)分類問題), 可能是一個向量(此時對應(yīng)序列標(biāo)注問題)。判別模型常用于處理分類問題(比如鑒定垃圾郵件)、圖像識別等等。
再說一說生成模型(Generative Model)。生成模型可以描述數(shù)據(jù)的生成過程。換句話說,已知了這個模型,我們就可以產(chǎn)生該模型描述的數(shù)據(jù)。而數(shù)據(jù)由兩部分組成,也就是(X,Y),前者是特征,后者則是類別(Y是標(biāo)量)或者序列類別(Y是向量)。要描述整個數(shù)據(jù),也就是要對p(X,Y)進(jìn)行建模,所以是對聯(lián)合概率進(jìn)行建模。生成模型本身不是做分類或者序列標(biāo)注的,但是可以用來解決這些問題,也可以用于生成式問題,比如聊天機(jī)器人、比如AI譜曲等問題。
而機(jī)器學(xué)習(xí)可以分成下面幾種類別:
- 監(jiān)督學(xué)習(xí)從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)出一個函數(shù),當(dāng)新的數(shù)據(jù)到來時,可以根據(jù)這個函數(shù)預(yù)測結(jié)果。監(jiān)督學(xué)習(xí)的訓(xùn)練集要求是包括輸入和輸出,也可以說是特征和目標(biāo)。訓(xùn)練數(shù)據(jù)中的目標(biāo)是由人標(biāo)注的。常見的監(jiān)督學(xué)習(xí)算法包括回歸分析和統(tǒng)計分類。
- 無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)相比,訓(xùn)練集沒有人為標(biāo)注的結(jié)果。常見的無監(jiān)督學(xué)習(xí)算法有聚類。
- 半監(jiān)督學(xué)習(xí)介于監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之間。它主要考慮如何利用少量的標(biāo)注樣本和大量的未標(biāo)注樣本進(jìn)行訓(xùn)練和分類的問題。。
- 增強(qiáng)學(xué)習(xí)通過觀察來學(xué)習(xí)做成如何的動作。每個動作都會對環(huán)境有所影響,學(xué)習(xí)對象根據(jù)觀察到的周圍環(huán)境的反饋來做出判斷。
在傳統(tǒng)的機(jī)器學(xué)習(xí)領(lǐng)域,監(jiān)督學(xué)習(xí)***的問題是訓(xùn)練數(shù)據(jù)標(biāo)注成本比較高,而無監(jiān)督學(xué)習(xí)應(yīng)用范圍有限。利用少量的訓(xùn)練樣本和大量無標(biāo)注數(shù)據(jù)的半監(jiān)督學(xué)習(xí)一直是機(jī)器學(xué)習(xí)的研究重點(diǎn)。
當(dāng)前非常流行的深度學(xué)習(xí)GAN模型和半監(jiān)督學(xué)習(xí)的思路有相通之處,GAN是“生成對抗網(wǎng)絡(luò)”(Generative Adversarial Networks)的簡稱,包括了一個生成模型G和一個判別模型D,GAN的目標(biāo)函數(shù)是關(guān)于D與G的一個零和游戲,也是一個最小-***化問題。
GAN實際上就是生成模型和判別模型之間的一個模仿游戲。生成模型的目的,就是要盡量去模仿、建模和學(xué)習(xí)真實數(shù)據(jù)的分布規(guī)律;而判別模型則是要判別自己所得到的一個輸入數(shù)據(jù),究竟是來自于真實的數(shù)據(jù)分布還是來自于一個生成模型。通過這兩個內(nèi)部模型之間不斷的競爭,從而提高兩個模型的生成能力和判別能力。
(圖片來自Nvidia Deep Learning Training Workshop)
目前主流的深度學(xué)習(xí)框架:
- Caffe 由Berkeley提出
- TensorFlow 由Google提出 (Apache 2.0)
- Torch (BSD License), facebook是主要使用者
- MXNet 一個相對中立的機(jī)器學(xué)習(xí)框架(Apache 2.0), 被Amazon AWS使用
- CNTK2 由Microsoft提出 (MIT License)
人工智能在各個行業(yè)的公司分布
(圖片來源 http://www.shivonzilis.com/)
目前人工智能在各個領(lǐng)域的初創(chuàng)公司數(shù)量(2016年的數(shù)據(jù)):
- Deep learning/機(jī)器學(xué)習(xí) (通用)(123家公司)
- Deep learning/機(jī)器學(xué)習(xí) (應(yīng)用) (260家公司)
- NLP (通用) (154家公司)
- NLP (語音識別) (78家公司)
- 計算機(jī)視覺/圖像識別 (通用) (106家公司)
- 計算機(jī)視覺/圖像識別 (應(yīng)用) (83 家公司)
- 手勢控制 (33 家公司)
- 虛擬個人助理 (92 家公司)
- 智能機(jī)器人 (65 家公司)
- 推薦系統(tǒng) (60 家公司)
- Context aware computing (28 家公司)
- 語音即時翻譯 (15 家公司)
- 視頻識別 (14 家公司)
下圖是目前人工智能在各個行業(yè)的熱度
上圖是2011到2016年最積極的人工智能企業(yè)投資者
下圖是福布斯關(guān)注的50家人工智能公司。
(圖片來自http://fortune.com/2017/02/23/artificial-intelligence-companies/)
融資最多的人工智能初創(chuàng)公司(2011-2016)
Sentient Technologies:使用先進(jìn)的人工智能技術(shù),大規(guī)模分布式計算和科學(xué)的方法來驗證新發(fā)現(xiàn)的策略,Sentient Technologies為各種領(lǐng)域中的復(fù)雜問題提供了新的解決方案。
Ayasdi:機(jī)器學(xué)習(xí)平臺,數(shù)據(jù)可視化,分析,金融技術(shù),醫(yī)療保健代理系統(tǒng):
Vicarious: 這是一家神秘的人工智能公司,Vicarious的目標(biāo)定位于“建立下一代的人工智能算法”。并且聲稱要構(gòu)建“像人類一樣思考的軟件”,實現(xiàn)“人腦級別的視覺、語言和自動控制系統(tǒng)”,致力于研究通用人工智能,目前他們的研究重點(diǎn)是實現(xiàn)人工視覺識別系統(tǒng)。
Context Relevant:Context Relevant通過使用機(jī)器學(xué)習(xí)驅(qū)動的自動化數(shù)據(jù)科學(xué)平臺,來解決一些世界上最棘手的大數(shù)據(jù),預(yù)測和行為挑戰(zhàn) - 比任何其他解決方案更快更有效。
Cortia:Cortica的技術(shù)模擬人類皮層,以便以***的精度理解和識別圖像。
Workfusion:WorkFusion是全球運(yùn)營的完整自動化解決方案,將您需要的復(fù)雜業(yè)務(wù)流程數(shù)字化所需的核心功能整合到一個平臺中:業(yè)務(wù)流程管理(BPM),機(jī)器人過程自動化(RPA),勞動力編排和機(jī)器學(xué)習(xí)提供的認(rèn)知自動化。
RapidMiner:開源預(yù)測分析平臺,使企業(yè)能夠在業(yè)務(wù)流程中包括預(yù)測分析
Digital Reasoning Systems:確保合規(guī)性,保持安全性,并快速準(zhǔn)確地分析信息。
H2O.ai:H2O是***的開源深度學(xué)習(xí)平臺。 H2O被超過80,000個數(shù)據(jù)科學(xué)家和超過9,000個組織使用。
Viv Labs:Viv在開發(fā)語音智能助理,已被三星收購。
參考文獻(xiàn):
http://fortune.com/ai-artificial-intelligence-deep-machine-learning/
https://en.wikipedia.org/wiki/Artificial_neural_network
http://fortune.com/2017/02/23/artificial-intelligence-companies/
https://www.amazon.com/b?ie=UTF8&node=16008589011#
http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/
Nvidia Deep Learning Training Workshop
Crunchbase
CB Insights