解決現(xiàn)實(shí)世界問(wèn)題的四大機(jī)器學(xué)習(xí)策略
機(jī)器學(xué)習(xí)有四種廣受認(rèn)可的形式:監(jiān)督式、無(wú)監(jiān)督式、半監(jiān)督式和強(qiáng)化式。在研究文獻(xiàn)中,這些形式得到了深入的探討。它們也被納入了大多數(shù)機(jī)器學(xué)習(xí)算法的入門課程。下表對(duì)這四種形式作了總結(jié)。

但一個(gè)并不廣為人知的概念是機(jī)器學(xué)習(xí)策略,即以創(chuàng)造性的方式,運(yùn)用基本的機(jī)器學(xué)習(xí)算法,解決現(xiàn)實(shí)世界問(wèn)題。我對(duì)這些策略產(chǎn)生了濃厚的興趣。在這篇文章中,我將探討四種策略:在線學(xué)習(xí)、遷移學(xué)習(xí)、集成學(xué)習(xí)和深度學(xué)習(xí)。好在,這四項(xiàng)策略適用于表格中任意一種機(jī)器學(xué)習(xí)形式。
一、在線學(xué)習(xí)
在線學(xué)習(xí)使用瞬息萬(wàn)變的數(shù)據(jù)。這類模型跟著數(shù)據(jù)及時(shí)更新,并不存儲(chǔ)先前的數(shù)據(jù)。有的在線學(xué)習(xí)算法還會(huì)“適應(yīng)”,即隨時(shí)調(diào)整模型,跟隨或追蹤數(shù)據(jù)的變化。具體而言,它們會(huì)逐漸“遺忘”過(guò)時(shí)數(shù)據(jù),從而適用于環(huán)境/模型隨時(shí)變動(dòng)的應(yīng)用程序。批量(或離線)學(xué)習(xí)使用靜態(tài)的數(shù)據(jù),可以充當(dāng)在線學(xué)習(xí)的熱身。在批量學(xué)習(xí)中,模型一次性完成所有數(shù)據(jù)的學(xué)習(xí)。很多在線學(xué)習(xí)算法使用一個(gè)批量/離線算法(以一小批數(shù)據(jù)為基礎(chǔ)),為模型作啟動(dòng)前的熱身。這種做法可以顯著加快算法的收斂(convergence)速度。
二、遷移學(xué)習(xí)
遷移學(xué)習(xí)將一個(gè)領(lǐng)域的知識(shí)應(yīng)用到另一個(gè)領(lǐng)域。它將舊的數(shù)據(jù)、模型和參數(shù)用于新問(wèn)題的解決,對(duì)于機(jī)器學(xué)習(xí)模型的終身學(xué)習(xí)而言至關(guān)重要。遷移學(xué)習(xí)是人與生俱來(lái)的能力。舉個(gè)例子,我們會(huì)將已經(jīng)掌握的語(yǔ)言知識(shí)(詞匯、語(yǔ)法等),應(yīng)用到新語(yǔ)言的學(xué)習(xí)中。兩種語(yǔ)言越是接近,知識(shí)遷移就越簡(jiǎn)單。
三、集成學(xué)習(xí)
單學(xué)習(xí)器模型只用一個(gè)學(xué)習(xí)器(算法),而集成學(xué)習(xí)使用多個(gè)學(xué)習(xí)器。一般的集成算法包含梯度提升、引導(dǎo)聚集、決策森林、堆棧集成和超級(jí)學(xué)習(xí)器。集成學(xué)習(xí)可以結(jié)合相對(duì)較弱(很多情況下,預(yù)測(cè)精度只略高于隨機(jī)猜測(cè))的學(xué)習(xí)器,產(chǎn)生強(qiáng)大、準(zhǔn)確的模型。
四、深度學(xué)習(xí)
深度學(xué)習(xí)包含多個(gè)層,可以學(xué)習(xí)數(shù)據(jù)的層級(jí)化或多尺度特征。與之相對(duì)的是“淺層學(xué)習(xí)”,即簡(jiǎn)單地運(yùn)用普通的機(jī)器學(xué)習(xí)建模算法。通常,淺層學(xué)習(xí)離不開特征工程(feature engineering),以保障輸入以適當(dāng)?shù)男问匠尸F(xiàn)給模型,而深度學(xué)習(xí)在訓(xùn)練時(shí),就自然而然地學(xué)會(huì)了這些特征。
在用機(jī)器學(xué)習(xí)算法解決日常業(yè)務(wù)難題時(shí),機(jī)器學(xué)習(xí)策略是我們要考慮的又一個(gè)方面。