自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

人工智能三大關(guān)鍵能力,終于有人講明白了

人工智能 深度學(xué)習(xí)
人類(lèi)的智慧寬廣而復(fù)雜。有些人類(lèi)成就遠(yuǎn)遠(yuǎn)超出現(xiàn)今機(jī)器可達(dá)的領(lǐng)域,要想讓機(jī)器觸及這些領(lǐng)域,還需要一段漫長(zhǎng)的時(shí)間。對(duì)于解決抽象問(wèn)題、概念生成、情緒知識(shí)、創(chuàng)造力甚至是自我認(rèn)知,即便是最強(qiáng)有力的深度學(xué)習(xí)算法,也無(wú)法在這些領(lǐng)域與人類(lèi)智慧相提并論。

 把所有這些認(rèn)知能力融合到一臺(tái)機(jī)器中,從而能夠應(yīng)對(duì)所有通用場(chǎng)景的人工智能稱為通用人工智能。目前,通用人工智能還停留在理論階段。

不過(guò),當(dāng)前的技術(shù)在執(zhí)行特定類(lèi)型任務(wù)方面取得了較大成功,這些任務(wù)過(guò)去都依賴于人類(lèi)智力。我們稱這類(lèi)人工智能為狹義人工智能或弱人工智能。弱人工智能主要指三種能力:學(xué)習(xí)、感知和認(rèn)知。

 

人工智能三大關(guān)鍵能力,終于有人講明白了

 

▲AI能力備忘單

上圖概述了本文介紹的AI的核心能力。

談到AI的時(shí)候,客戶們不停地在問(wèn):“這事兒成了嗎?”在一個(gè)AI被過(guò)度炒作的世界,確實(shí)很難分清AI是幻想還是現(xiàn)實(shí),是實(shí)際能力還是營(yíng)銷(xiāo)表演。

所有這些能力在今天都是真實(shí)存在的。今天的AI是真實(shí)的,成千上萬(wàn)的公司正在使用AI進(jìn)行業(yè)務(wù)轉(zhuǎn)型。關(guān)注AI未來(lái)的可能性固然重要,但是你更需要了解現(xiàn)在的AI能做些什么。

01 學(xué)習(xí)

 

人工智能三大關(guān)鍵能力,終于有人講明白了

 

▲學(xué)習(xí)——無(wú)顯式編程的學(xué)習(xí)

機(jī)器學(xué)習(xí)的首要特征就是隨時(shí)間學(xué)習(xí)的能力,并且不需要明確編程。和人類(lèi)一樣,機(jī)器學(xué)習(xí)算法通過(guò)探索與實(shí)踐學(xué)習(xí),而不是遵循一步步的指令(當(dāng)然我知道有些讀者是小孩子的父母,有時(shí)候你們可不希望孩子們這樣)。

機(jī)器學(xué)習(xí)算法是按照學(xué)習(xí)方式分類(lèi)的。當(dāng)下最流行的、你的企業(yè)90%的時(shí)間可能都會(huì)采用的技術(shù)就是有監(jiān)督學(xué)習(xí)。

有監(jiān)督學(xué)習(xí)使用包含輸入和期望輸出的數(shù)據(jù)集。通過(guò)迭代優(yōu)化,學(xué)習(xí)算法可以找到一個(gè)函數(shù),對(duì)輸入如何轉(zhuǎn)化為輸出進(jìn)行建模。這個(gè)模型會(huì)被應(yīng)用于訓(xùn)練集外的新的輸入,并預(yù)測(cè)對(duì)應(yīng)的輸出。

找到正確的算法和參數(shù),部分靠科學(xué),部分靠創(chuàng)造力和直覺(jué)。如何將機(jī)器學(xué)習(xí)應(yīng)用于這一過(guò)程本身就是個(gè)研究課題——這種技術(shù)稱為自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)。

有監(jiān)督學(xué)習(xí)算法都有相同的缺陷:它們需要大量數(shù)據(jù)。而且不是任何數(shù)據(jù)都行,它們需要同時(shí)包含輸入和對(duì)應(yīng)輸出的訓(xùn)練數(shù)據(jù),也稱之為標(biāo)記數(shù)據(jù)。

有時(shí)我們會(huì)有在記錄系統(tǒng)或交互系統(tǒng)中存儲(chǔ)的已經(jīng)標(biāo)記過(guò)的歷史數(shù)據(jù)。例如,對(duì)于客戶流失模型——我們可以查看流失客戶的歷史數(shù)據(jù),加上客戶的歷史交互一起作為訓(xùn)練數(shù)據(jù)的輸出部分。通過(guò)使用正確的算法,我們僅僅通過(guò)查看一系列的交互,就能夠預(yù)測(cè)未來(lái)的客戶流失情況。

然而有時(shí)我們不會(huì)如此幸運(yùn),數(shù)據(jù)并不會(huì)被標(biāo)記。無(wú)監(jiān)督學(xué)習(xí)算法會(huì)處理一組沒(méi)有標(biāo)記的數(shù)據(jù)并找出其中的結(jié)構(gòu)。聚類(lèi)算法是無(wú)監(jiān)督學(xué)習(xí)算法中最流行的一種,它通過(guò)不同的技術(shù),在數(shù)據(jù)中找到共性并對(duì)其分組。你可能使用這種算法對(duì)你的客戶群或網(wǎng)頁(yè)訪問(wèn)者進(jìn)行客戶細(xì)分。

其他常用的無(wú)監(jiān)督學(xué)習(xí)算法有關(guān)聯(lián)規(guī)則(定義數(shù)據(jù)間的關(guān)聯(lián),如購(gòu)買(mǎi)某種特定產(chǎn)品的用戶會(huì)對(duì)其他特定產(chǎn)品感興趣)和異常檢測(cè)(找出與主體數(shù)據(jù)不同的罕見(jiàn)或可疑部分?jǐn)?shù)據(jù))。

在其他情況下,我們完全不使用訓(xùn)練數(shù)據(jù)。想想人們?nèi)绾螌W(xué)會(huì)玩一款視頻游戲。解決這個(gè)問(wèn)題的有監(jiān)督方法就是觀看成千上萬(wàn)的游戲視頻并從中學(xué)習(xí)。這是許多Youtube播主的商業(yè)模式,我的孩子們就看這種視頻,但我發(fā)現(xiàn)這種方式極度枯燥。

一個(gè)更有趣的學(xué)習(xí)方法是實(shí)際上手玩這個(gè)游戲。在玩的過(guò)程中,如果我們做對(duì)了(比如得分)就會(huì)得到正向強(qiáng)化,如果我們做錯(cuò)了(比如被殺死)就會(huì)得到負(fù)向強(qiáng)化。強(qiáng)化學(xué)習(xí)算法就是這么做的:它們通過(guò)探索環(huán)境并強(qiáng)化正確的行為來(lái)學(xué)習(xí)機(jī)器學(xué)習(xí)的功能。

強(qiáng)化學(xué)習(xí)由于其不需要數(shù)據(jù)的特性,成為商業(yè)上一種極其有前途的機(jī)器學(xué)習(xí)方式。它特別適合自動(dòng)化系統(tǒng)——無(wú)論是移動(dòng)的(如車(chē)輛、遙控飛機(jī))還是靜止的(如空調(diào)系統(tǒng)、電力系統(tǒng))——同時(shí)也可以應(yīng)用于復(fù)雜的業(yè)務(wù)流程。強(qiáng)化學(xué)習(xí)通常被認(rèn)為是AI中最困難的學(xué)科。

02 感知

 

人工智能三大關(guān)鍵能力,終于有人講明白了

 

▲感知——解釋周邊世界

如果說(shuō)有某個(gè)領(lǐng)域?yàn)槿祟?lèi)所獨(dú)有,那就是感知了。數(shù)十年來(lái),我們嘗試模仿人類(lèi)的能力去感知周?chē)氖澜?,卻鮮有成功。理解一幅圖畫(huà)或?qū)⒄Z(yǔ)音轉(zhuǎn)文字的復(fù)雜度使其幾乎無(wú)法用編程的方式實(shí)現(xiàn)——想象一下如何用一步步的指令來(lái)定義圖片里的一匹馬。

機(jī)器學(xué)習(xí)算法更適合解決這類(lèi)問(wèn)題。然而,傳統(tǒng)機(jī)器學(xué)習(xí)算法在處理感知任務(wù)時(shí)的準(zhǔn)確性與人類(lèi)能做到的程度相去甚遠(yuǎn)(我仍然記得在Windows Vista上給開(kāi)發(fā)們演示語(yǔ)音識(shí)別功能的情景……這件事教我學(xué)會(huì)要做個(gè)更堅(jiān)強(qiáng)的人!)。

以圖像分類(lèi)為例。ImageNet是圖像分類(lèi)中最著名的挑戰(zhàn)。自2010年起,全球的參與者提交他們的算法來(lái)創(chuàng)建最精準(zhǔn)的模型。在競(jìng)賽初期(即2010年),能達(dá)到的較好的誤差率約在25%左右。作為比較,同一數(shù)據(jù)集下人類(lèi)對(duì)應(yīng)的誤差率約為5.1%。

到了2012年,Alex Krizhevsky(一位來(lái)自多倫多大學(xué)的學(xué)生)提交了他的方案:一個(gè)包含8層名為AlexNet的神經(jīng)網(wǎng)絡(luò)。AlexNet擊敗了其他競(jìng)爭(zhēng)對(duì)手,達(dá)到了15.3%的誤差率—比僅次于他的競(jìng)爭(zhēng)者低了10個(gè)點(diǎn)。

在接下來(lái)的數(shù)年內(nèi),他引入的技術(shù)被持續(xù)改進(jìn)并增加了更多層數(shù),直到2014年,一個(gè)名為GoogLeNet的22層神經(jīng)網(wǎng)絡(luò)達(dá)到了6.7%的誤差率。

次年,一個(gè)來(lái)自微軟研究院的團(tuán)隊(duì)提交了使用全新神經(jīng)網(wǎng)絡(luò)技術(shù)的作品,其神經(jīng)網(wǎng)絡(luò)的深度達(dá)到了超大的152層,誤差率僅為3.57%,首次超過(guò)了人類(lèi)的表現(xiàn)。

深度學(xué)習(xí)永遠(yuǎn)地改變了計(jì)算機(jī)視覺(jué)。如今,這項(xiàng)技術(shù)實(shí)際上已經(jīng)被用于計(jì)算機(jī)視覺(jué)的所有高精度場(chǎng)景,這使其成為企業(yè)中最常見(jiàn)的用例。以下是一些計(jì)算機(jī)視覺(jué)在當(dāng)今的應(yīng)用:

  • 為圖像的內(nèi)容分類(lèi)(影像分類(lèi))
  • 識(shí)別一幅圖像中的多個(gè)物體,并識(shí)別每個(gè)物體的邊界(物體檢測(cè))
  • 識(shí)別圖像中的場(chǎng)景或行為(如:工作場(chǎng)所的不安全情形,或零售商店的補(bǔ)貨)
  • 檢測(cè)人臉,識(shí)別身份,甚至辨識(shí)每張臉的情緒
  • 識(shí)別書(shū)寫(xiě)文本,包含手寫(xiě)體文本(光學(xué)字符識(shí)別)
  • 鑒別圖像或視頻里的攻擊性行為

研究員Harold Stolovitch和Erica Keeps在他們的書(shū)Telling Ain’t Training(ASTD出版社)中斷言,我們獲取的信息中,有83%來(lái)自視覺(jué),次之是聽(tīng)覺(jué),提供了11%的感覺(jué)輸入。兩者合起來(lái)占據(jù)了我們從外界獲取信息的94%。毫無(wú)疑問(wèn),音頻處理是人工智能關(guān)注的另一個(gè)較大領(lǐng)域,僅次于計(jì)算機(jī)視覺(jué)。

相似的深度學(xué)習(xí)技術(shù)可以應(yīng)用到音頻信號(hào)上,幫助計(jì)算機(jī)識(shí)別聲音。你可以利用這項(xiàng)能力區(qū)分鳥(niǎo)兒們的歌聲,或通過(guò)風(fēng)力渦輪機(jī)發(fā)出的聲音來(lái)預(yù)測(cè)故障。

不過(guò)人工智能在音頻處理方面最激動(dòng)人心的還是語(yǔ)音識(shí)別。用于語(yǔ)音識(shí)別的參照數(shù)據(jù)集被稱為總機(jī),它包含了約260小時(shí)的電話交談錄音。測(cè)量后人類(lèi)的轉(zhuǎn)錄誤差率為5.9%。該誤差率在2016年被微軟研究院設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)追平,并于1年后被其以5.1%的誤差率擊敗。有史以來(lái)第一次,一臺(tái)機(jī)器可以比人類(lèi)自身更好地理解人類(lèi)。

這些突破不但讓機(jī)器更懂我們,而且使得機(jī)器可以用自然的方式與我們溝通。2018年,Azure上線了基于深度學(xué)習(xí)開(kāi)發(fā)的文字轉(zhuǎn)語(yǔ)音服務(wù),該服務(wù)能夠合成出與真人無(wú)異的人聲。

這些能力的結(jié)合將實(shí)現(xiàn)計(jì)算機(jī)科學(xué)的法寶:全自然用戶接口(NUI)。機(jī)器既可以看見(jiàn)和理解人類(lèi),又可以用自然語(yǔ)言與人類(lèi)交流,這看起來(lái)就像是我們已經(jīng)實(shí)現(xiàn)了科幻電影的幻想一樣。不過(guò),我們真的做到了嗎?要與計(jì)算機(jī)進(jìn)行真正有意義的交流,計(jì)算機(jī)不但要能轉(zhuǎn)錄我們說(shuō)的話,還要能理解話里的意思。

自然語(yǔ)言處理(NLP)是人工智能中從人類(lèi)語(yǔ)言中分析、理解并提取含義的領(lǐng)域。NLP最常見(jiàn)的場(chǎng)景之一就是語(yǔ)言理解,語(yǔ)言理解是現(xiàn)代會(huì)話型人工智能體驗(yàn)(比如數(shù)字助理)的基礎(chǔ)。

當(dāng)你向Siri、Alexa或Cortana詢問(wèn)天氣時(shí),系統(tǒng)首先將你的會(huì)話音頻轉(zhuǎn)換成文字,然后通過(guò)自然語(yǔ)言理解模型抽取出你的意圖,然后將意圖(如“獲取天氣”)映射到對(duì)應(yīng)輸出(在這個(gè)例子中,就是提供當(dāng)?shù)氐奶鞖庑畔?。

NLP技術(shù)在過(guò)去幾年中飛速發(fā)展。有些只能處理簡(jiǎn)單任務(wù),比如情緒分析、關(guān)鍵字抽取或個(gè)體識(shí)別,有些則可以處理更復(fù)雜的任務(wù),如文本歸納或翻譯。2018年,微軟的機(jī)器翻譯團(tuán)隊(duì)首次在自動(dòng)翻譯方面達(dá)到人類(lèi)水平——這是個(gè)極度復(fù)雜的任務(wù),曾一度被認(rèn)為是不可能實(shí)現(xiàn)的。

自然語(yǔ)言理解最激動(dòng)人心的應(yīng)用之一便是機(jī)器閱讀理解。2018年1月,來(lái)自微軟亞洲研究院的團(tuán)隊(duì)使用斯坦福問(wèn)答數(shù)據(jù)集(SQuAD)達(dá)到了人類(lèi)的水平,該數(shù)據(jù)集由針對(duì)一組維基百科文章的問(wèn)題所組成。實(shí)際上,有關(guān)這些文章的開(kāi)放性問(wèn)題,系統(tǒng)能夠給出比人類(lèi)更好的答案。許多公司為之做出了貢獻(xiàn),幫助它走得更遠(yuǎn)。

盡管如此,這些系統(tǒng)仍然無(wú)法達(dá)到人類(lèi)的抽象層次。在其核心,問(wèn)答算法會(huì)搜索文本來(lái)尋找可以指向正確答案的線索。對(duì)于每個(gè)問(wèn)題,系統(tǒng)都要搜索整個(gè)文本來(lái)匹配。人類(lèi)也這么做(特別是當(dāng)我們很匆忙時(shí)),但是當(dāng)我們真正想理解一段文字時(shí),我們會(huì)從中抽取知識(shí),進(jìn)行概括,并使其更易于理解。

想象一段描述加利福尼亞的文字。人類(lèi)會(huì)從這段文字中歸納出“加利福尼亞”這個(gè)實(shí)體并給它賦予屬性(如人口、面積),甚至與其他實(shí)體的關(guān)系(如鄰州、地方長(zhǎng)官)。歸納后,我們不再需要那段文字來(lái)回答關(guān)于加利福尼亞的問(wèn)題。我們已經(jīng)概括了有關(guān)的知識(shí)。

人工智能中與此過(guò)程對(duì)應(yīng)的是知識(shí)抽取,其對(duì)企業(yè)有著深遠(yuǎn)的意義。通過(guò)使用這些技術(shù),我們可以從混沌、無(wú)序,甚至令人困惑的信息中抽取高階概念。結(jié)果知識(shí)圖不但能用于回答關(guān)于整個(gè)數(shù)據(jù)產(chǎn)業(yè)的寬泛?jiǎn)栴},還能瀏覽和理解這些信息。

這種水平的抽象遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)NLP的能力范圍,使其更接近我們所說(shuō)的認(rèn)知。

03 認(rèn)知

 

人工智能三大關(guān)鍵能力,終于有人講明白了

 

▲認(rèn)知——基于數(shù)據(jù)進(jìn)行推理

嚴(yán)格來(lái)說(shuō),認(rèn)知是獲取和處理知識(shí)的能力。它包含人腦用于推理、理解、解決問(wèn)題、計(jì)劃和決策的高層次概念。

我們目前探索的技術(shù)包含了一定程度的認(rèn)知,雖然有時(shí)不那么明顯。以圖像分類(lèi)為例,如果我們仔細(xì)審視用于圖像分類(lèi)的深度神經(jīng)網(wǎng)絡(luò),實(shí)際上就可以看出神經(jīng)網(wǎng)絡(luò)是如何在每一層將問(wèn)題分解成更小的步驟的。

沒(méi)有人工干預(yù),神經(jīng)網(wǎng)絡(luò)自動(dòng)展示了某種程度的概括:第一層檢測(cè)簡(jiǎn)單的特性,如邊緣或紋理。往更深層走,每一層都能夠抽取更復(fù)雜的屬性,如圖案或元素。某種意義上,神經(jīng)網(wǎng)絡(luò)已經(jīng)可以獲取一些知識(shí)并使用這些知識(shí)做一些基礎(chǔ)推理。

自然語(yǔ)言處理展示了類(lèi)似的內(nèi)在抽象。在其核心,大部分現(xiàn)代的NLP技術(shù)都使用了被稱為詞嵌入的技術(shù)。通過(guò)詞嵌入技術(shù),文本中的每個(gè)詞都轉(zhuǎn)換為一個(gè)代表單詞含義的向量。在這個(gè)新的空間,語(yǔ)義相似的詞(如“天氣”和“預(yù)報(bào)”)彼此接近。

通過(guò)這種方式,系統(tǒng)會(huì)將“今天天氣如何?”和“獲取未來(lái)24小時(shí)的預(yù)報(bào)”匹配為相同的意圖。即使詞不同,它們的含義卻是相似的,因?yàn)樗鼈兊恼Z(yǔ)義相近。翻譯也是相同的工作原理:翻譯技術(shù)使用詞嵌入來(lái)抽象輸入的文本,將其轉(zhuǎn)換為與語(yǔ)言無(wú)關(guān)的“想法”,再用反向流程將其翻譯為任意一種語(yǔ)言。

在這些例子中,認(rèn)知是感知的內(nèi)在。然而,許多人工智能場(chǎng)景是單純的認(rèn)知。它們不專(zhuān)注于感知周?chē)氖澜?,而是?zhuān)注于抽象這個(gè)世界并基于抽象進(jìn)行推理。一些最基礎(chǔ)的有監(jiān)督學(xué)習(xí)方法便是如此?;貧w分析是根據(jù)現(xiàn)有信息預(yù)測(cè)數(shù)值的能力,例如基于房屋的特征和位置評(píng)估其價(jià)值,或根據(jù)歷史數(shù)據(jù)預(yù)估其銷(xiāo)售額。

分類(lèi)是根據(jù)物品自身特征對(duì)其分級(jí)或分類(lèi)的能力,例如,判斷一棟房屋是不是會(huì)被出售給某個(gè)特定的買(mǎi)家。優(yōu)化算法則是基于流程進(jìn)行推論,從而最大化某個(gè)特定的結(jié)果,比如在醫(yī)院里分配資源。

推薦系統(tǒng)僅通過(guò)評(píng)分或購(gòu)買(mǎi)習(xí)慣就能夠找出電影、書(shū)籍或歌曲等物品間不為人知的共性。其他技術(shù),如前所述,如聚類(lèi)分析能找出數(shù)據(jù)中的模式,并以無(wú)監(jiān)督方式對(duì)物品歸類(lèi)。

我們?cè)趶?qiáng)化學(xué)習(xí)技術(shù)中也能看到認(rèn)知能力。2017年,蒙特利爾微軟研究院(前馬魯巴島)跨越了100萬(wàn)分大關(guān),創(chuàng)造了吃豆人游戲的新紀(jì)錄。該系統(tǒng)通過(guò)玩成千上萬(wàn)把游戲來(lái)實(shí)現(xiàn)自我訓(xùn)練。

同樣地,在2018年,OpenAI Five(一個(gè)由五個(gè)神經(jīng)網(wǎng)絡(luò)組成的團(tuán)隊(duì))在Dota2游戲中打敗了人類(lèi)隊(duì)伍。OpenAI Five通過(guò)自我對(duì)戰(zhàn)進(jìn)行訓(xùn)練,每天的訓(xùn)練量相當(dāng)于180年游戲時(shí)長(zhǎng)。

最著名的例子應(yīng)該是由Google DeepMind取得的成就:其系統(tǒng)AlphaGo第一次擊敗了一位9段圍棋專(zhuān)業(yè)選手。相對(duì)于其他游戲(如象棋),圍棋被認(rèn)為是對(duì)電腦來(lái)說(shuō)更為困難的游戲。

深入觀察所有AI系統(tǒng)參與的游戲,你會(huì)覺(jué)得它們展現(xiàn)出了認(rèn)知的另外一種特征——計(jì)劃。系統(tǒng)能夠提前“思考”最佳的方式來(lái)獲得長(zhǎng)期看來(lái)最大化的分?jǐn)?shù)。

責(zé)任編輯:華軒 來(lái)源: 今日頭條
相關(guān)推薦

2021-01-17 22:55:08

人工智能機(jī)器學(xué)習(xí)深度學(xué)習(xí)

2020-10-11 20:38:06

人工智能

2020-12-16 13:33:10

人工智能人工智能技術(shù)

2020-08-20 08:31:58

人工智能

2022-02-23 17:03:18

人工智能深度學(xué)習(xí)機(jī)器學(xué)習(xí)

2022-02-11 09:12:13

人工智能深度學(xué)習(xí)機(jī)器學(xué)習(xí)

2021-01-26 10:59:41

5G人工智能5G+人工智能

2021-01-24 23:08:34

5G人工智能智能家居

2018-03-21 09:34:08

2020-05-18 10:18:48

人工智能

2021-01-26 10:17:48

智能語(yǔ)音大數(shù)據(jù)機(jī)器學(xué)習(xí)

2021-01-26 16:17:42

人工智能機(jī)器學(xué)習(xí)智能語(yǔ)音

2021-06-13 12:03:46

SaaS軟件即服務(wù)

2021-10-09 00:02:04

DevOps敏捷開(kāi)發(fā)

2022-03-27 20:32:28

Knative容器事件模型

2020-12-29 14:17:06

人工智能機(jī)器學(xué)習(xí)深度學(xué)習(xí)

2021-03-25 11:24:25

爬蟲(chóng)技術(shù)開(kāi)發(fā)

2022-04-27 18:25:02

數(shù)據(jù)采集維度

2021-10-17 20:38:30

微服務(wù)內(nèi)存組件

2020-11-03 07:04:39

云計(jì)算公有云私有云
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)