9 大主題!機(jī)器學(xué)習(xí)算法理論面試題大匯總
機(jī)器學(xué)習(xí)是一門(mén)理論性和實(shí)戰(zhàn)性都比較強(qiáng)的技術(shù)學(xué)科。在應(yīng)聘機(jī)器學(xué)習(xí)相關(guān)工作崗位時(shí),我們常常會(huì)遇到各種各樣的機(jī)器學(xué)習(xí)問(wèn)題和知識(shí)點(diǎn)。
算法理論基礎(chǔ)不僅包含基本概念、數(shù)學(xué)基礎(chǔ),也包含了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)相關(guān)。今天給大家推薦一個(gè)不錯(cuò)的算法理論基礎(chǔ)面試題匯總資源,已開(kāi)源~
首先放上這份開(kāi)源面試題匯總的地址:
https://github.com/sladesha/Reflection_Summary
其作者是 SladeSal 和 tcandzq,來(lái)自 2020 屆校招面試各類(lèi)算法問(wèn)題及個(gè)人理解的匯總。目前已經(jīng)收獲 900+ 的贊了~
資源目錄:
- 基礎(chǔ)概念
- 數(shù)學(xué)
- 數(shù)據(jù)預(yù)處理
- 機(jī)器學(xué)習(xí)
- 深度學(xué)習(xí)
- 自然語(yǔ)言處理
- 推薦
- 風(fēng)控
- 評(píng)價(jià)指標(biāo)
下面來(lái)看一下詳細(xì)內(nèi)容,一睹為快!
1. 基礎(chǔ)概念
基礎(chǔ)概念部分包含了 5 個(gè)主題,分別是:方差和偏差、生成與判別模型、先驗(yàn)概率和后驗(yàn)概率、頻率概率、AutoML。每個(gè)主題都包含若干常見(jiàn)、高頻出現(xiàn)的面試題。
例如“如何解釋偏差、方差,模型訓(xùn)練為什么要引入偏差和方差?”
問(wèn)題的解釋都來(lái)自面試題的精煉總結(jié),不羅嗦,簡(jiǎn)單易懂。
2. 數(shù)學(xué)
數(shù)學(xué)部分包含了 12 個(gè)主題,分別是:數(shù)據(jù)質(zhì)量、最大公約數(shù)問(wèn)題、牛頓法、擬牛頓法、概率密度分布、平面曲線的切線和法線、導(dǎo)數(shù)、微分中值定理、泰勒公式、歐拉公式、矩陣、概率論。
例如,看下關(guān)于泰勒公式的講解:
泰勒公式一句話描述:就是用多項(xiàng)式函數(shù)去逼近光滑函數(shù)。常見(jiàn)的泰勒公式有:
3. 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理部分包含了 5 個(gè)主題,分別是數(shù)據(jù)平衡、異常點(diǎn)處理、缺失值處理、特征選擇、特征提取。數(shù)據(jù)預(yù)處理是機(jī)器學(xué)習(xí)算法的重要組成部分。
例如“為什么需要對(duì)數(shù)據(jù)進(jìn)行變換?”,“歸一化和標(biāo)準(zhǔn)化之間的關(guān)系?”
這部分作者總結(jié)得很詳細(xì),后面還有展開(kāi)!關(guān)于連續(xù)特征的常用方法,作者引入一張圖進(jìn)行總結(jié)歸納:
4. 機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)部分包含了 9 個(gè)主題,分別是:聚類(lèi)、線性回歸、邏輯回歸、決策樹(shù)、貝葉斯、隨機(jī)森林、集成學(xué)習(xí)、FM/FFM、SVM。這部分內(nèi)容詳實(shí),核心面試題也總結(jié)得很好。
例如 SVM 面試題非常豐富,涵蓋得比較全面。眾所周知,支持向量機(jī)(Support Vector Machine, SVM)是一類(lèi)按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類(lèi)的廣義線性分類(lèi)器,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面。
關(guān)于KKT限制條件,KKT條件有哪些、引入拉格朗日的優(yōu)化方法后的損失函數(shù)解釋、核函數(shù)的作用是啥、核函數(shù)的種類(lèi)和應(yīng)用場(chǎng)景作者都有詳細(xì)解釋。
5. 深度學(xué)習(xí)
深度學(xué)習(xí)部分包含了 8 個(gè)主題,分別是:dropout、batch_normalization、bp過(guò)程、embedding、softmax、梯度消失/爆炸、殘差網(wǎng)絡(luò)、Attention。
例如“殘差網(wǎng)絡(luò)為什么能解決梯度消失的問(wèn)題?”
6. 自然語(yǔ)言處理
自然語(yǔ)言處理部分包含了 8 個(gè)主題,分別是:GloVe、WordsVec、CRF、LDA、LSTM、GRU、Bert、文本相似度計(jì)算。
例如“word2vec和glove區(qū)別?”
7. 推薦
推薦部分包含 8 個(gè)主題,分別是:DIN、DeepFM、YoutubeNet、Wide&Deep、MLR、Neural Network全家桶、XDeepFM、Recall。
8. 風(fēng)控
風(fēng)控部分包含了 2 個(gè)主題,分別是:孤立森林和評(píng)分卡。
9. 評(píng)價(jià)指標(biāo)
評(píng)價(jià)指標(biāo)包含了 5 個(gè)主題,分別是:二分類(lèi)、多分類(lèi)、回歸指標(biāo)、聚類(lèi)指標(biāo)、排序指標(biāo)。
總的來(lái)說(shuō),這是一份不錯(cuò)的算法理論基礎(chǔ)面試資源,作者對(duì)常見(jiàn)的大廠面試題做了較好的歸納和總結(jié)。幫助大家對(duì)這些知識(shí)點(diǎn)進(jìn)行梳理和理解,以便能夠更好地應(yīng)對(duì)機(jī)器學(xué)習(xí)筆試包括面試。
目前該項(xiàng)目應(yīng)該還在補(bǔ)充完善。
最后,再次放上該資源的 GitHub 開(kāi)源地址:
https:// github.com/sladesha/Ref lection_Summary