Kevin P. Murphy《概率機(jī)器學(xué)習(xí):進(jìn)階》成書,還開放了PDF下載
今天,谷歌研究科學(xué)家 Kevin P. Murphy 正式宣布:《概率機(jī)器學(xué)習(xí):進(jìn)階》書稿已經(jīng)完成,并面向公眾提供免費(fèi)下載。
這本書是《概率機(jī)器學(xué)習(xí):簡(jiǎn)介》的續(xù)編,說起來,Kevin P. Murphy 的概率機(jī)器學(xué)習(xí)書算是經(jīng)典教材了,所以去年他宣布再版的消息曾引起廣泛關(guān)注。
在第二卷《進(jìn)階》中,作者擴(kuò)展了機(jī)器學(xué)習(xí)的范圍,以包含更具挑戰(zhàn)性的問題。例如探討了在多種不同分布下的學(xué)習(xí)和測(cè)試;生成高維輸出,如圖像、文本和圖形;基于潛在變量模型發(fā)現(xiàn)數(shù)據(jù)「洞察力」的方法;以及如何在決策和控制任務(wù)中使用概率模型和推理。
消息公布后,一部分讀者立即下載了第二卷書稿并開始學(xué)習(xí),另一部分讀者則突然想起去年下載的第一卷還沒翻開過……
不過,Kevin P. Murphy 提到,這本書也還沒有全部完成,目前缺失一章內(nèi)容且需要進(jìn)一步校對(duì)。他還會(huì)對(duì)網(wǎng)絡(luò)發(fā)布版本進(jìn)行微調(diào),最終書稿將在今年夏天發(fā)送給 MIT 出版社。
或許是因?yàn)榈诙沓蓵男侍撸晃蛔x者表示大受震撼:「什么?第一卷我還沒看完啊……」
更多讀者還是表達(dá)了對(duì)第二卷新書的期待:
「你找不到比這兩本書更全面、更連貫的現(xiàn)代機(jī)器學(xué)習(xí)評(píng)論了(這里是第二本書)。這套書籍提供了一流的教育效果,只需要你愿意閱讀……」
閱讀本書之前,讀者應(yīng)該基本了解 (監(jiān)督) 機(jī)器學(xué)習(xí)和其他相關(guān)的數(shù)學(xué)主題 (概率、統(tǒng)計(jì)、線性代數(shù)、優(yōu)化)。這些背景材料在第一卷中有所涉及,不過第二卷是自成一體的,先閱讀第一卷不是必需的。
第二卷涵蓋了眾多主題,因此不可能把全部?jī)?nèi)容都放進(jìn)書稿中,一些額外的材料可以在書籍主頁的線上補(bǔ)充中找到,這個(gè)頁面還包含用于復(fù)現(xiàn)書中大部分圖形的 Python 代碼。
作者表示,第二卷《概率機(jī)器學(xué)習(xí):進(jìn)階》將于 2023 年正式出版。同時(shí),去年成稿的第一卷《概率機(jī)器學(xué)習(xí):簡(jiǎn)介》近日也已經(jīng)正式出版,只是價(jià)格略貴:
第二卷的整體目錄如下:
- 書籍地址:https://github.com/probml/pml2-book/releases/latest/download/pml2.pdf
- 完整目錄:https://probml.github.io/pml-book/pml2/toc2-long-2022-02-27.pdf
這本書側(cè)重于概率建模和推理,用于解決四種主要任務(wù):預(yù)測(cè) (分類和回歸) 、生成 (圖像和文本生成) 、發(fā)現(xiàn) (聚類、降維和狀態(tài)估計(jì)) 和控制 (決策)。
第一部分更詳細(xì)地介紹了這個(gè)領(lǐng)域的一些基本原理,并對(duì)一些第一卷中缺少的細(xì)節(jié)進(jìn)行了詳細(xì)介紹。
第二部分討論了各種概率模型中的貝葉斯推理算法。這些不同的算法在速度、精度、通用性等方面的影響不同,由此產(chǎn)生的方法可以應(yīng)用于許多不同的問題。
第三部分討論了預(yù)測(cè)方法,用于適合 p (y|x) 形式的條件分布,其中 x ∈ X 是輸入(通常是高維的),y ∈ Y 是期望的輸出(通常是低維的)。這一部分假設(shè)了存在一個(gè)想要預(yù)測(cè)的正確答案,盡管通常這個(gè)答案是不確定的。
第四部分討論了生成模型,形式為 p (y) 或 p (y|x),其中可能有多個(gè)有效輸出。例如,給定一個(gè)文本提示符 x,希望生成一組多樣化的圖片 y 與標(biāo)題相匹配。在預(yù)測(cè)設(shè)置中,評(píng)估這些模型比評(píng)估標(biāo)題更難,因?yàn)樗钠谕敵鍪遣磺宄摹?/span>
第五部分將注意力轉(zhuǎn)向了數(shù)據(jù)分析,討論了一些旨在揭示有意義的潛在狀態(tài)或模式的方法。這部分主要關(guān)注潛在變量模型,它們是 p (z, y) = p (z) p (y|z) 的聯(lián)合模型,其中 z 是隱藏狀態(tài),y 是觀測(cè)值,目標(biāo)是從 y 中推斷 z。(該模型可以選擇性地以固定的輸入為條件,得到 p (z, y|x)。)此外還探討了一些方法,用于發(fā)現(xiàn)以 p (y|x) 形式的預(yù)測(cè)模型隱式學(xué)習(xí)到的模式,而不依賴于顯式的生成模型。
最后,第六部分討論了如何使用概率模型和推理在不確定性中進(jìn)行決策,引出了因果關(guān)系這個(gè)重要命題。
此外,由于內(nèi)容涉及范圍廣泛,大約三分之一的章節(jié)是與客座作者共同撰寫或合作撰寫的,這些客座作者都是領(lǐng)域?qū)<?(參見下面的貢獻(xiàn)者完整名單)。