詳解人工智能十大經(jīng)典應(yīng)用領(lǐng)域及其技術(shù)原理
本文將使用“算法”一詞,以高度簡(jiǎn)化的方式來描述單個(gè)算法、模型或者使用多種算法的軟件。在每個(gè)類別中,逐一討論數(shù)據(jù)輸入的類型、作為黑箱的算法以及輸出(為了簡(jiǎn)便易行,即使真實(shí)算法不是黑箱也暫且把它當(dāng)成黑箱)。
因?yàn)檫@是高層次的概述,所以我鼓勵(lì)你深入研究感興趣的具體應(yīng)用,搞清楚它們究竟是如何應(yīng)用于行業(yè)或者業(yè)務(wù)活動(dòng)的。目前也有很多資源可供使用,以學(xué)習(xí)所涉及的技術(shù)細(xì)節(jié)和具體算法。
01 預(yù)測(cè)分析
預(yù)測(cè)是預(yù)測(cè)分析或者預(yù)測(cè)建模的同義詞,這是根據(jù)有標(biāo)簽,以及有時(shí)甚至無標(biāo)簽的輸入數(shù)據(jù)來判斷輸出數(shù)據(jù)的過程。在機(jī)器學(xué)習(xí)和人工智能中,預(yù)測(cè)分析可以進(jìn)一步細(xì)分為回歸和分類。
下面將對(duì)使用有標(biāo)簽數(shù)據(jù)(有監(jiān)督)進(jìn)行預(yù)測(cè)的兩個(gè)子類進(jìn)行討論。
1. 回歸
圖1-1展示了在回歸方法中輸入有標(biāo)簽數(shù)據(jù),經(jīng)預(yù)測(cè)模型處理,然后從連續(xù)數(shù)列中生成數(shù)值的過程(例如股市的閉市價(jià))。

▲圖1-1:回歸
應(yīng)用包括客戶全周期的股票價(jià)值和凈利潤(rùn)、收入及其增長(zhǎng)預(yù)測(cè)、價(jià)格變動(dòng)、信貸違約風(fēng)險(xiǎn)以及股票交易計(jì)算。
2. 分類
分類指的是輸入有標(biāo)簽數(shù)據(jù),經(jīng)過分類模型處理后,把輸入數(shù)據(jù)分成一類或多類的過程,如圖1-2所示。

▲圖1-2:分類
垃圾郵件過濾器是二元分類應(yīng)用的標(biāo)準(zhǔn)案例。電子郵件是經(jīng)分類模型處理后的輸入數(shù)據(jù),輸出數(shù)據(jù)是確定了的垃圾郵件或者非垃圾郵件,非垃圾郵件專指那些不含垃圾內(nèi)容的好郵件。垃圾郵件會(huì)被送入垃圾箱,而非垃圾郵件則被送入收件箱。
假如引入第三個(gè)類別“不確定”,那么分類器現(xiàn)在就可以把輸入的郵件分成三類。因?yàn)槌^了兩個(gè)類別,所以這是多元分類的例子。在該例子中,電子郵件的客戶端可能有“疑似垃圾郵件”的文件夾供用戶審查每封郵件,并以此訓(xùn)練分類器更好地區(qū)分垃圾與非垃圾郵件。
如果要把輸入數(shù)據(jù)分成三類或更多類,那么算法可以為輸入數(shù)據(jù)選擇單一類別或者計(jì)算輸入數(shù)據(jù)屬于每個(gè)類別的概率。在后一種情況下,可以采用概率最大的類別作為選擇的結(jié)果,或者采用所有類別的概率來按你自己定制的規(guī)則處理。
在這種情況下,假定一封剛收到的郵件被確定有85%的可能性是垃圾郵件,10%的可能性是非垃圾郵件,5%的可能性為不確定。因?yàn)槭抢]件的可能性比較高,因此可以判定該郵件為垃圾郵件,或者以其他方式來使用計(jì)算出的概率。
最后,某些算法可以為同一輸入分配多個(gè)標(biāo)簽。這里有一個(gè)與圖像識(shí)別相關(guān)的例子,假設(shè)輸入的數(shù)據(jù)是紅蘋果的圖像,那么算法可以為該圖像分配紅色、蘋果和水果等多個(gè)不同的標(biāo)簽。該案例為圖像分配所有三個(gè)類別的做法是合適的。
應(yīng)用包括信用風(fēng)險(xiǎn)、貸款審批和客戶流失。分類可以與本文后續(xù)討論的識(shí)別應(yīng)用相結(jié)合。
02 個(gè)性化和推薦系統(tǒng)
推薦系統(tǒng)是依據(jù)現(xiàn)有信息進(jìn)行推薦的一種個(gè)性化形式,其結(jié)果與各個(gè)用戶甚為相關(guān)。其可以用來提高客戶轉(zhuǎn)化率、銷售率、滿意度和留存率。事實(shí)上,亞馬遜就是通過增加這些引擎把營(yíng)業(yè)收入提高了35%, 75%的Netflix觀賞節(jié)目也來自于這樣的推薦。
推薦系統(tǒng)是一種特別的信息過濾系統(tǒng)。也可以通過用戶搜索、排名和評(píng)分的辦法來完成個(gè)性化。推薦系統(tǒng)根據(jù)諸如商品或者用戶等的輸入數(shù)據(jù),經(jīng)過推薦模型或者引擎的處理來完成推薦(例如產(chǎn)品、文章、音樂、電影),如圖2所示。

▲圖2:推薦系統(tǒng)
值得一提的是與推薦系統(tǒng)相關(guān)的“冷啟動(dòng)問題”。冷啟動(dòng)是指智能應(yīng)用尚未擁有足夠的信息來為特定用戶或者群體做出高度個(gè)性化和關(guān)聯(lián)度的推薦。例如,用戶尚未產(chǎn)生關(guān)于它們的偏好、興趣或購(gòu)買歷史的信息。
另一個(gè)例子是當(dāng)商品(例如衣服、產(chǎn)品、視頻、歌曲)剛剛面世的時(shí)候。有幾種技術(shù)有助于解決這個(gè)問題,但因篇幅所限就不深入討論了。
推薦系統(tǒng)應(yīng)用包括推薦產(chǎn)品、視頻、音樂、歌曲、書籍和電視節(jié)目(例如亞馬遜、Netflix、Spotify)。除了推薦以外,也包括個(gè)性化的內(nèi)容,包括新聞、報(bào)道、電郵和定向廣告(例如推特)。
其他的案例還包括個(gè)性化醫(yī)療計(jì)劃、個(gè)性化圖像和圖標(biāo)(例如YouTube、Netflix、Yelp)、葡萄酒推薦、個(gè)性化購(gòu)物(例如完美的夾克衫搭配)、時(shí)尚穿搭(例如StitchFix)以及全套的自動(dòng)化推薦。
03 計(jì)算機(jī)視覺
計(jì)算機(jī)視覺是一個(gè)廣闊的領(lǐng)域,它包括涉及諸如圖像和視頻之類視覺信息的模式識(shí)別(下一節(jié)將討論另外一種技術(shù))。計(jì)算機(jī)視覺以照片、靜止的視頻圖像和一系列圖像(視頻)作為輸入,經(jīng)過模型的處理,產(chǎn)生輸出,如圖3所示。

▲圖3:計(jì)算機(jī)視覺
輸出可以是識(shí)別、檢測(cè)和發(fā)現(xiàn)某個(gè)目標(biāo)、特征或者活動(dòng)。視覺相關(guān)的應(yīng)用隱含著一定程度的自動(dòng)化,特別是自動(dòng)化視覺,通常需要人在應(yīng)用中參與(例如檢查)。機(jī)器視覺一詞用來描述在工業(yè)應(yīng)用中的類似或者有一定重疊度的技術(shù),諸如檢查、過程控制、測(cè)量和機(jī)器人。
計(jì)算機(jī)視覺有許多有趣而且強(qiáng)大的應(yīng)用,同時(shí)應(yīng)用場(chǎng)景也在快速增加。例如,可以在下述場(chǎng)景中使用計(jì)算機(jī)視覺:
- 視頻分析和內(nèi)容篩選
- 唇讀
- 指揮自動(dòng)化機(jī)器(例如汽車和無人機(jī))
- 視頻識(shí)別和描述
- 視頻字幕
- 識(shí)別像擁抱和握手之類的人際交互動(dòng)作
- 機(jī)器人及其控制系統(tǒng)
- 人群密度估算
- 清點(diǎn)人數(shù)(例如排隊(duì)、基礎(chǔ)設(shè)施規(guī)劃、零售)
- 檢查與質(zhì)量控制
- 零售客戶步行路徑分析以及參與度分析
無人航空器(UAV)經(jīng)常被稱為無人機(jī)。通過應(yīng)用計(jì)算機(jī)視覺,無人機(jī)能夠執(zhí)行檢查(例如石油管道、無線信號(hào)塔)、完成建筑和區(qū)域搜索、幫助制作地圖和送貨。計(jì)算機(jī)視覺現(xiàn)在正廣泛應(yīng)用于公安、安保和監(jiān)控。當(dāng)然,這類應(yīng)用也要注意符合倫理道德,保護(hù)人們的利益。
計(jì)算機(jī)視覺還有最后一件事值得一提。通過看、聞、聽、觸和味五大感覺,人類能夠感知環(huán)境和周圍的世界。感官捕獲信息,然后傳遞到神經(jīng)系統(tǒng)進(jìn)行轉(zhuǎn)換,同時(shí)也決定應(yīng)該采取什么行動(dòng)或者應(yīng)該做出什么樣的反應(yīng)。計(jì)算機(jī)視覺是對(duì)特定人工智能應(yīng)用視覺的一種類比。
04 模式識(shí)別
模式識(shí)別涉及輸入非結(jié)構(gòu)化數(shù)據(jù),經(jīng)過模型處理,繼而檢測(cè)是否存在某種特定的模式(檢測(cè)),然后為識(shí)別出的模式分配一個(gè)類別(分類),或者發(fā)現(xiàn)所識(shí)別模式的主題(識(shí)別),如圖4-1所示。

▲圖4-1:模式識(shí)別
這些應(yīng)用的輸入可以包括圖像(包括視頻——一系列靜止的圖像)、音頻(例如講話、音樂和聲音)和文本。文本可以根據(jù)其特性進(jìn)一步細(xì)分為電子、手寫或者打印(例如紙、支票、車牌號(hào))。
以圖像為輸入的目的可能是檢測(cè)目標(biāo)、識(shí)別目標(biāo)、發(fā)現(xiàn)目標(biāo),或者三者皆有。人臉識(shí)別就是一個(gè)好例子。訓(xùn)練模型來檢測(cè)圖像中的人臉,并對(duì)檢測(cè)到的目標(biāo)進(jìn)行分類,打上人的標(biāo)簽,這就是目標(biāo)檢測(cè)的例子,這里的目標(biāo)是未經(jīng)識(shí)別的人臉。
“檢測(cè)”用來指代所發(fā)現(xiàn)的不同于背景的目標(biāo)。其也包括對(duì)目標(biāo)位置的測(cè)量和圍繞被檢測(cè)目標(biāo)邊際框的具體測(cè)量。識(shí)別是指為檢測(cè)到的目標(biāo)分類或打標(biāo)簽的過程(在本案例中是人臉),識(shí)別會(huì)更進(jìn)一步,并為所識(shí)別的人臉分配一個(gè)身份。圖4-2呈現(xiàn)了一些圖像識(shí)別的案例。

▲圖4-2:圖像識(shí)別與檢測(cè)
諸如人臉識(shí)別這樣的生物特征識(shí)別技術(shù)可以用來為圖中的人自動(dòng)打標(biāo)簽。生物特征識(shí)別的另外一種形式是根據(jù)指紋來識(shí)別。
其他的應(yīng)用包括:
- 讀出視頻和音頻中的文字
- 在圖像上打標(biāo)簽和分類
- 汽車保險(xiǎn)中基于圖像來評(píng)估汽車受損程度
- 從視頻和音頻中提取信息
- 基于面部和聲音的情感識(shí)別
- 面部表情識(shí)別
音頻識(shí)別的應(yīng)用包括:
- 語音識(shí)別
- 將語音轉(zhuǎn)換為文本
- 分離并識(shí)別出講話者
- 基于聲音、實(shí)時(shí)客服和銷售電話的情感智能分析
- 伐木和森林砍伐聲音檢測(cè)
- 缺陷檢測(cè)(例如制造過程中的缺陷或零配件失效)
最后,手寫或打印的文本可以通過光學(xué)字符識(shí)別(OCR)和手寫字符識(shí)別轉(zhuǎn)換為電子文檔。文檔也可以轉(zhuǎn)換為語音,但這被認(rèn)為更可能是人工智能的生成性應(yīng)用,而不是識(shí)別性應(yīng)用。本文稍后會(huì)討論生成性應(yīng)用。
05 聚類和異常檢測(cè)
圖5中所示的聚類和異常檢測(cè)是兩種最常見的無監(jiān)督機(jī)器學(xué)習(xí)技術(shù)。它們也被認(rèn)為是模式識(shí)別技術(shù)。

▲圖5:聚類和異常檢測(cè)
這兩個(gè)過程都以無標(biāo)簽數(shù)據(jù)作為輸入,經(jīng)過相應(yīng)算法(聚類或異常檢測(cè))的處理,在聚類的場(chǎng)景下完成分組,或者在異常檢測(cè)場(chǎng)景下確定是否屬于異常。我們首先討論聚類。
聚類把無標(biāo)簽數(shù)據(jù)中相似的數(shù)據(jù)聚合成組。具體的組數(shù)由完成聚類任務(wù)的人(通常是數(shù)據(jù)科學(xué)家)決定。并沒有絕對(duì)正確或者錯(cuò)誤的組數(shù),但對(duì)某一特定的應(yīng)用,通??梢酝ㄟ^試錯(cuò)來確定理想的組數(shù)。
因?yàn)閿?shù)據(jù)沒有標(biāo)簽,所以聚類者必須為每組指定某種含義或標(biāo)簽以便清楚地描述(例如運(yùn)動(dòng)狂)。然后用模型把新數(shù)據(jù)分配給某個(gè)組,從而假定該組的標(biāo)簽或描述??梢园堰@個(gè)過程想象成某種形式的預(yù)測(cè)分類,也就是為每個(gè)新數(shù)據(jù)點(diǎn)分配一個(gè)類(通過分組標(biāo)簽)。
把新數(shù)據(jù)點(diǎn)(例如客戶)分配給集群(細(xì)分市場(chǎng)),會(huì)為我們提供一種可以精準(zhǔn)定位、個(gè)性化以及策略性定位產(chǎn)品的更好方法,并可以用合適的方式來對(duì)每個(gè)細(xì)分市場(chǎng)的客戶進(jìn)行營(yíng)銷。
聚類應(yīng)用包括細(xì)分和聚焦市場(chǎng)與客戶、三維醫(yī)療影像分析、按照購(gòu)物習(xí)慣分類產(chǎn)品以及社交媒體分析。
異常檢測(cè)是用來檢測(cè)異常數(shù)據(jù)(高度不尋常、偏離常規(guī)或畸形)模式的一種技術(shù)。異常檢測(cè)應(yīng)用包括基于音頻的缺陷和裂紋檢測(cè)、網(wǎng)絡(luò)安全、質(zhì)量控制(例如制造缺陷檢測(cè))以及計(jì)算機(jī)與網(wǎng)絡(luò)系統(tǒng)健康(例如NASA的缺陷和錯(cuò)誤檢測(cè))。
在網(wǎng)絡(luò)安全的異常檢測(cè)應(yīng)用方面,常見的威脅包括惡意軟件、勒索軟件、計(jì)算機(jī)病毒、系統(tǒng)和內(nèi)存攻擊、拒絕服務(wù)(DoS)攻擊、網(wǎng)絡(luò)釣魚、不需要的程序執(zhí)行、憑據(jù)盜竊、數(shù)據(jù)傳輸和盜竊等。毋庸諱言,這方面的異常檢測(cè)場(chǎng)景層出不窮。
06 自然語言
自然語言是人工智能發(fā)展與應(yīng)用中非常有趣且令人激動(dòng)的領(lǐng)域,通常分成三個(gè)子領(lǐng)域:自然語言處理(NLP)、自然語言生成(NLG)和自然語言理解(NLU)。讓我們分別進(jìn)行討論。
1. NLP
自然語言處理(NLP)輸入文本、語音或手寫形式的語言,經(jīng)過NLP算法處理后,輸出結(jié)構(gòu)化的數(shù)據(jù),如圖6-1所示?,F(xiàn)在有很多潛在的NLP場(chǎng)景和輸出。

▲圖6-1:NLP
值得一提的是,有時(shí)NLP也被認(rèn)為是NLG和NLU的超集,因此人工智能自然語言應(yīng)用在總體上可以被認(rèn)為是NLP的一種形式。也有人認(rèn)為它是自然語言應(yīng)用的特定集合,我們正在討論的就是其中的一部分。
與NLP相關(guān)的具體任務(wù)和技術(shù)包括:
- 量化和目標(biāo)文本分析
- 語音識(shí)別(語音轉(zhuǎn)換為文本)
- 話題模型(例如話題以及文檔中討論的主題)
- 文本分類(例如電視劇《權(quán)利的游戲》)
- 情感分析(例如正面、負(fù)面、中性)
- 主體檢測(cè)(例如人、地點(diǎn))
- 命名識(shí)別(例如大峽谷、邁爾斯·戴維斯)
- 語義相似性分析(例如不同詞和文本之間在總體上意思的相似性)
- 為部分語音打標(biāo)簽(例如名詞、動(dòng)詞)
- 機(jī)器翻譯(例如英文到法文的翻譯)
一個(gè)具體的NLP應(yīng)用涉及公司會(huì)議錄音、文本轉(zhuǎn)換,然后提供會(huì)議總結(jié),其中包括圍繞不同話題的分析和會(huì)議表現(xiàn)(https://www.chorus.ai)。
另外一個(gè)應(yīng)用采用NLP來對(duì)招聘面試進(jìn)行分析,并根據(jù)性別中立性、語調(diào)、措辭等因素給出整體評(píng)分。它還為提高評(píng)分和整體工作描述提供優(yōu)化建議。
其他的應(yīng)用還包括:
- 基于情感的新聞聚合
- 情感驅(qū)動(dòng)的社會(huì)媒體調(diào)查以及品牌監(jiān)控
- 基于消息板的父母疫苗關(guān)注分析
- 電影評(píng)論和產(chǎn)品評(píng)論的情感分析
- 動(dòng)物聲音轉(zhuǎn)換
現(xiàn)在有許多云服務(wù)提供商通過NLP服務(wù)和API接口來提供這方面的一些功能。
2. NLG
NLG以結(jié)構(gòu)化數(shù)據(jù)的形式來輸入語言,經(jīng)過NLG算法處理,產(chǎn)生對(duì)應(yīng)語言作為輸出,如圖6-2所示。這種語言輸出可以是文本或者文本轉(zhuǎn)換為語音的形式。結(jié)構(gòu)化輸入數(shù)據(jù)的案例可以是比賽中運(yùn)動(dòng)員情況的統(tǒng)計(jì)數(shù)據(jù)、廣告效果數(shù)據(jù)或者公司的財(cái)務(wù)數(shù)據(jù)。

▲圖6-2:NLG
應(yīng)用包括:
- 根據(jù)句子和文檔自動(dòng)產(chǎn)生文本概述https://arxiv.org/abs/1602.06023https://arxiv.org/abs/1603.07252
- 簡(jiǎn)要回顧(例如新聞和體育)
- 關(guān)于圖片的故事
- 業(yè)務(wù)分析報(bào)告概要
- 招聘人員參與醫(yī)院研究
- 自然語言形式的患者醫(yī)院賬單
- 夢(mèng)幻足球選秀總結(jié)和每周比賽回顧
- 房產(chǎn)描述和房地產(chǎn)市場(chǎng)報(bào)告
- 與公司收入報(bào)告相關(guān)的新聞發(fā)布
安德烈·卡帕西創(chuàng)建的模型可以自動(dòng)產(chǎn)生維基百科文章、嬰兒姓名、數(shù)學(xué)論文、計(jì)算機(jī)代碼和莎士比亞的模型。其他的應(yīng)用包括生成手寫文本甚至創(chuàng)作笑話。
3. NLU
最后,NLU以語言為輸入(文本、語音或手寫),經(jīng)過NLU算法的處理,產(chǎn)生可以被理解的語言作為輸出,如圖6-3所示。所產(chǎn)生的可理解語言可以用來采取行動(dòng)、生成響應(yīng)、回答問題、進(jìn)行對(duì)話等。

▲圖6-3:NLU
“理解”一詞可以非常深?yuàn)W且具有哲學(xué)性質(zhì),并會(huì)涉及領(lǐng)悟的概念,注意到這一點(diǎn)非常重要。理解所指的能力,往往不僅是領(lǐng)悟信息(與死記硬背相反),而且是把理解的信息與現(xiàn)存知識(shí)整合,并以此作為不斷增長(zhǎng)的知識(shí)基礎(chǔ)。
缺乏與人類相似的語言理解和領(lǐng)悟是今天基于自然語言的人工智能應(yīng)用的一大缺憾,其根源在于讓機(jī)器獲取與人類相似的語言理解能力難于上青天。還記得前面關(guān)于人工智能現(xiàn)狀和人工智能難題的討論嗎?這就是一個(gè)明證。
在不進(jìn)行全面哲學(xué)討論的情況下,讓我們僅用術(shù)語“理解”來表示算法(重申,大大簡(jiǎn)化)能夠?qū)斎胝Z言做更多的工作,而不僅是解析并執(zhí)行簡(jiǎn)單的任務(wù),如文本分析。NLU要解決的問題顯然比NLP和NLG(普通人工智能問題)難得多,而且NLU是實(shí)現(xiàn)通用人工智能(AGI)的主要基本組成。
目前的NLU日臻完善,已經(jīng)有了包括個(gè)人虛擬助理、聊天機(jī)器人、客戶成功(支持與服務(wù))代理、銷售代理等在內(nèi)的應(yīng)用。這些應(yīng)用通常包括某些形式的手寫內(nèi)容或語音對(duì)話,經(jīng)常圍繞著信息搜集、問題解答或者某些協(xié)助性工具。
個(gè)人助理的具體應(yīng)用案例包括諸如亞馬遜的Alexa、蘋果的Siri、谷歌的Assistant以及Nuance的Nina。聊天機(jī)器人的應(yīng)用案例包括潤(rùn)滑油專家、工作面試、學(xué)生貸款顧問和商業(yè)保險(xiǎn)專家。這是人工智能研究非?;钴S和有潛在發(fā)展空間的領(lǐng)域,絕對(duì)值得關(guān)注。
07 時(shí)間序列和基于序列的數(shù)據(jù)
多數(shù)情況下,數(shù)據(jù)都是按照序列采集的,因此數(shù)據(jù)的序列極為重要而且由特定索引所確定。
最為常見的數(shù)據(jù)序列索引是時(shí)間,按時(shí)間排序的數(shù)據(jù)被稱為時(shí)間序列數(shù)據(jù)。每天交易時(shí)段股票的價(jià)格波動(dòng)、DNA序列、物聯(lián)網(wǎng)傳感器數(shù)據(jù),以及諸如風(fēng)向等科學(xué)現(xiàn)象,都是時(shí)間序列的好例子。
時(shí)間序列分析和建??捎糜趯W(xué)習(xí)、判斷和預(yù)測(cè)基于時(shí)間的事件,包括趨勢(shì)、季節(jié)變動(dòng)、循環(huán)和噪聲。
對(duì)某些特定應(yīng)用,字母和單詞的序列也是有效的序列數(shù)據(jù),這些序列被打上不同的標(biāo)簽,諸如n-grams、skip-grams、句子、段落,甚至語言本身,其中語言是以語音、文字或者電子的方式來表達(dá)的。另外,音頻和視頻也是序列數(shù)據(jù)。
應(yīng)用包括:
- 預(yù)測(cè)(回歸與分類)
- 異常檢測(cè)
- 預(yù)測(cè)貨幣的未來兌換率
- 健康趨勢(shì)的實(shí)時(shí)追蹤
- 市場(chǎng)預(yù)測(cè)
- 天氣預(yù)報(bào)
- 基于序列的推薦
- 情感分析
- DNA測(cè)序
- 文本生成
- 序列到序列的預(yù)測(cè)(如機(jī)器翻譯)
08 信息搜索、提取、排序和評(píng)分
許多強(qiáng)大的人工智能應(yīng)用都圍繞著信息的搜索、提取和排序(評(píng)分)。這特別適用于非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),例如文本文檔、網(wǎng)頁、圖像和視頻。
可以使用這類數(shù)據(jù)(有時(shí)候輔以結(jié)構(gòu)化數(shù)據(jù))來提取信息、提供搜索或優(yōu)化處理推薦,以及按照相關(guān)性、重要性或優(yōu)先級(jí)來對(duì)條目進(jìn)行排序或評(píng)分。這組技術(shù)大多都與個(gè)性化有關(guān),因?yàn)樗阉鹘Y(jié)果和其他條目可以按照針對(duì)某個(gè)用戶或群體的相關(guān)性的大小排列或排序。
目前,有許多搜索任務(wù)都是通過鍵盤輸入或者語音提供給諸如谷歌這樣的搜索引擎,該引擎使用谷歌獨(dú)有的人工智能搜索算法。電子商務(wù)應(yīng)用也使用他們自己的引擎來搜索產(chǎn)品,搜索過程可以由文本、聲音(語音)及視覺輸入驅(qū)動(dòng)。
文本搜索包括谷歌搜索、微軟的Bing,以及分布式、透明和社區(qū)驅(qū)動(dòng)的搜索。
基于聲音和圖像的搜索應(yīng)用包括:
- 衣服和時(shí)裝搜索
- 歌曲和藝術(shù)家搜索
- Pinterest鏡頭搜索
- 圖像和視頻搜索
- 字體搜索
視頻搜索基于圖像內(nèi)容進(jìn)行搜索。早就有購(gòu)物應(yīng)用采取這種方式。用戶把拍攝的照片提交給視頻搜索引擎。接著用照片產(chǎn)生相似性搜索結(jié)果,諸如衣服。有些圖像引擎也能以視覺方式展示相似的其他產(chǎn)品和推薦。
除了分類技術(shù)以外,還有排序和評(píng)分技術(shù),包括下述這些應(yīng)用:
- 銷售線索評(píng)分
- 信息與文檔檢索(例如網(wǎng)頁搜索)
- 機(jī)器翻譯
- 致病基因搜索與發(fā)現(xiàn)
- 測(cè)定蛋白質(zhì)的順序結(jié)構(gòu)
09 強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)(RL)與這里迄今描述過的人工智能技術(shù)迥然不同(簡(jiǎn)單回想一下前面提到的人類學(xué)習(xí)的方法)?;镜南敕ㄊ怯幸粋€(gè)代理在虛擬環(huán)境中行動(dòng)以獲得積極的回報(bào)。每個(gè)動(dòng)作都會(huì)引起環(huán)境狀態(tài)的變化,而且每個(gè)動(dòng)作都由稱為策略的模型來決定。策略嘗試確定在給定狀態(tài)下要采取的優(yōu)秀操作。
如果暫時(shí)不理解請(qǐng)別擔(dān)心;我會(huì)舉個(gè)例子,希望能解釋得更清楚。圖9很形象地展示了強(qiáng)化學(xué)習(xí)。

▲圖9:強(qiáng)化學(xué)習(xí)
你可以考慮以游戲《吃豆女士》(Ms. Pac-Man,為何不是Ms. Pac-Woman?)為例。吃豆女士的目標(biāo)是吃掉屏幕上所有的點(diǎn),但是更大的目標(biāo)是從可能吃掉的點(diǎn)中獲得最多的分?jǐn)?shù)。為什么得分最多才是真正的目標(biāo)?或者說為什么要玩這個(gè)游戲?
首先,得分越多,能得到的自由生命就越長(zhǎng),自由生命越長(zhǎng)就能玩得越久,就可以繼續(xù)積累更多的分?jǐn)?shù)。其次,如果能完成比賽或者創(chuàng)造世界紀(jì)錄,就能獲得正式的“吹牛權(quán)”,誰不希望呢?
在這種情況下,得分是獎(jiǎng)勵(lì),吃豆女士是代理,環(huán)境是屏幕,參與其中的人(玩家)是通過操縱游戲控制桿決定采取行動(dòng)的策略。
當(dāng)然環(huán)境是有狀態(tài)的。有一個(gè)普通的不易察覺的情況,那就是在吃豆女士吃屏幕上的點(diǎn)和水果時(shí),必須躲開追趕她的幽靈,還有一個(gè)不可戰(zhàn)勝的情況,那就是當(dāng)吃豆女士吃了無敵藥丸(我不知道它到底叫什么)后,她就可以吃掉幽靈從而得到很多額外的分。
決定無敵與非無敵的是環(huán)境狀態(tài)的變化,也是代理人在環(huán)境中能力的變化。
值得一提的是,在人們玩《吃豆女士》游戲的過程中,有時(shí)會(huì)受完成屏幕目標(biāo)的驅(qū)使,盡可能打通更多關(guān)卡而不是得最多分。在這種情況下,人們只會(huì)使用無敵狀態(tài)來加速,吃盡可能多的不受阻礙的點(diǎn),可能不會(huì)通過吃幽靈來得到最多分。
假設(shè)你有強(qiáng)化學(xué)習(xí)應(yīng)用,目標(biāo)是得最多分。在這種情況下,應(yīng)用將嘗試學(xué)習(xí)如何做到這一點(diǎn),也就是吃盡可能多的幽靈和水果。
還有一件事要提,得分是一種積極的回報(bào)。碰到幽靈喪命是一種消極的回報(bào)。隨著時(shí)間的推移,強(qiáng)化應(yīng)用應(yīng)該嘗試最大化得分和最小化生命損失。盡管這個(gè)例子是在游戲場(chǎng)景中構(gòu)建的,但是我們可以通過許多其他的方式來使用強(qiáng)化學(xué)習(xí)。
應(yīng)用包括:
- 擊敗圍棋世界冠軍
- 找到神經(jīng)網(wǎng)絡(luò)的優(yōu)秀配置
- 機(jī)器人技術(shù)
- 優(yōu)化藥物劑量
- 優(yōu)化交通信號(hào)控制
- 優(yōu)化化學(xué)反應(yīng)
- 自動(dòng)駕駛
10 混合、自動(dòng)化與其他
實(shí)際應(yīng)用的最后一節(jié)指出了一些應(yīng)用,因?yàn)樯婕岸喾N組合技術(shù),或者不適合已經(jīng)討論過的任何類別,所以將它們歸類為混合或雜項(xiàng)。
應(yīng)用案例包括:
- 自動(dòng)駕駛汽車和車隊(duì)以及自動(dòng)駕駛航天飛機(jī)
- 實(shí)時(shí)飛行路線預(yù)測(cè)和空中交通優(yōu)化
- 無人駕駛賽車
- 倉(cāng)庫(kù)物流和揀配自動(dòng)化
- 狗和類人機(jī)器人
- 機(jī)器人類人的巧手
- 珊瑚礁監(jiān)測(cè)水母機(jī)器人
- 醫(yī)院病患護(hù)理工作自動(dòng)化
- 疾病暴發(fā)預(yù)測(cè)
- 減少冷卻費(fèi)用
- 天氣預(yù)報(bào)
- 自動(dòng)化會(huì)議協(xié)調(diào)
- 預(yù)測(cè)維護(hù)
- 與物聯(lián)網(wǎng)相關(guān)的智能系統(tǒng)
人工智能開發(fā)的另一個(gè)真正有趣的領(lǐng)域是生成性應(yīng)用,基本上指能從特定類型輸入為給定應(yīng)用生成某些東西的人工智能。包括下面這些例子:
- 根據(jù)文本生成圖像
- 生成圖像和圖像區(qū)域描述
- 生成星系和火山的圖像
- 根據(jù)草圖生成圖像
- 根據(jù)歌曲的特點(diǎn)生成音樂
- 生成多樣化的聲音和語音
- 合成唱歌
- 根據(jù)設(shè)計(jì)模型生成軟件代碼
- 根據(jù)文本生成視頻
其他的應(yīng)用包括風(fēng)格轉(zhuǎn)換(例如普通圖像轉(zhuǎn)換,使梵高或畢加索風(fēng)格的“藝術(shù)”再現(xiàn))。還有一種被稱為超分辨率成像技術(shù),通過生成缺失的三維圖像數(shù)據(jù),將二維圖像轉(zhuǎn)換為三維圖像。最后,圖像自動(dòng)著色是另一個(gè)有趣的人工智能應(yīng)用。