10本必讀的機器學(xué)習(xí)和數(shù)據(jù)科學(xué)免費在線電子書
KDnuggets 網(wǎng)站編輯 Matthew Mayo 挑選了一些機器學(xué)習(xí)和數(shù)據(jù)科學(xué)相關(guān)的書籍。是時候讓你的書架上新增幾本機器學(xué)習(xí)和數(shù)據(jù)科學(xué)書籍了,最重要的是這些書籍全部有免費的電子版!!!
1. 《Python 數(shù)據(jù)科學(xué)手冊》
本書介紹了在Python中處理數(shù)據(jù)所必需的核心庫:特別是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn和相關(guān)軟件包。讀這本書,你需要有Python基礎(chǔ),如果你沒有Python基礎(chǔ)可以先讀《A Whirlwind Tour of Python》這本書是針對Python語言快速入門的書
書籍鏈接:https://github.com/jakevdp/PythonDataScienceHandbook
2. 《Neural Networks and Deep Learning》
是一本免費的在線書籍。這本書主要概述兩大核心概念:
- 神經(jīng)網(wǎng)絡(luò),一個編程范例,使計算機可以從觀測數(shù)據(jù)中學(xué)習(xí)
- 深度學(xué)習(xí),這是一套強大的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)技術(shù)
神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)目前為圖像識別,語音識別和自然語言處理中的許多問題提供了***解決方案。本書將教授許多神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)背后的核心概念。
書籍鏈接:http://neuralnetworksanddeeplearning.com/
3. 《貝葉斯思維》
think X系列的書籍之一,大多數(shù)講貝葉斯統(tǒng)計的書,都是用數(shù)學(xué)符號,以數(shù)學(xué)概念(如微積分)為基礎(chǔ)展開的,此書則用Python代碼代替數(shù)學(xué)符號,用離散數(shù)學(xué)代替連續(xù)數(shù)學(xué)。這樣一來,數(shù)學(xué)里的積分變成了求和,概率分布的運算大多成了簡單的循環(huán)。
書籍鏈接:http://greenteapress.com/wp/think-bayes/
4. 《Machine Learning & Big Data》
這本書目前算是一部還沒完結(jié)的作品,其目的是為了讓軟件工程師可以在不依賴庫的情況下就能輕松構(gòu)建機器學(xué)習(xí)模型,從而在理論和實踐中獲得平衡,大多數(shù)情況下,模型背后的概念或技術(shù)都很簡單或者說比較直觀,但是細節(jié)和術(shù)語上就容易出問題。
另外,現(xiàn)有的庫基本可以解決現(xiàn)有的問題。更多的時候它們有自己的抽象和架構(gòu)來隱藏底層概念。本書的目的就是為了讓基本概念更清晰。
書籍鏈接:http://www.kareemalkaseer.com/books/ml
5. 《Statistical Learning with Sparsity》
在過去的十年中,計算和信息技術(shù)出現(xiàn)了爆炸性增長。隨著它在各種領(lǐng)域如醫(yī)學(xué),生物學(xué),金融和市場營銷中涌現(xiàn)出大量的數(shù)據(jù)。本書在一個通用的概念框架中闡述了這些領(lǐng)域重要的數(shù)據(jù)科學(xué)思想。
書籍鏈接:https://web.stanford.edu/~hastie/StatLearnSparsity/
6. 《Statistical inference for data science》
本書是作為數(shù)據(jù)科學(xué)專業(yè)領(lǐng)域的書籍,也是一部有關(guān)推論統(tǒng)計學(xué)的 Coursera配套書。值得一提的是,這本書有配套的Coursera課程視頻,可以在YouTube上找到。
本書旨在作為推論統(tǒng)計學(xué)的入門書籍。目標受眾是具有數(shù)學(xué)和計算機編程基礎(chǔ)的學(xué)生,他們希望將這些技能用于數(shù)據(jù)科學(xué)或統(tǒng)計學(xué)。這本書是免費提供的。
書籍鏈接:https://leanpub.com/LittleInferenceBook
7. 《凸優(yōu)化》
這是一本關(guān)于凸優(yōu)化的書,凸優(yōu)化是一類特殊的數(shù)學(xué)優(yōu)化問題,它包括最小二乘法和線性規(guī)劃問題。眾所周知,最小二乘法和線性規(guī)劃問題具有相當完善的理論,出現(xiàn)在各種應(yīng)用中,并且這些問題可以用編程來解決。這本書主要是面向?qū)嶋H應(yīng)用,豐富的案例是本書的特色
書籍鏈接:http://stanford.edu/~boyd/cvxbook/
8. 《Python 自然語言處理 》
這是一本關(guān)于自然語言處理的書。“自然語言”是指用于人類日常交流的語言,如英語,印地語或葡萄牙語等語言。與諸如編程語言和數(shù)學(xué)符號這樣的人造語言相比,自然語言在代代相傳的過程中不斷發(fā)展,并且很難用明確的規(guī)則來確定。我們將在廣義上采用自然語言處理(或簡稱NLP)來表示計算機對自然各種不同的自然語言的理解...
本書基于Python編程語言和一個自然語言工具包(NLTK)的開源庫。
書籍鏈接:https://automatetheboringstuff.com/
https://www.nltk.org/book/
9. 《Python 編程快速上手》
如果您曾花費數(shù)小時重命名文件或更新數(shù)百個電子表格單元格,你就能體會這些工作是多么的乏味。但是如果你可以讓你的電腦幫你做這些事,那感覺就不一樣了
看完這本書,你可以通過編寫Python程序,可以讓計算機自動完成它們,本書適合任何想要通過Python學(xué)習(xí)編程的讀者,尤其適合缺乏編程基礎(chǔ)的初學(xué)者。
書籍鏈接:https://automatetheboringstuff.com/
10. 《社會媒體挖掘》
社交媒體在過去十年的發(fā)展已經(jīng)徹底改變了人們的交流方式和行業(yè)開展業(yè)務(wù)的方式。個人通過社交媒體互動,共享和內(nèi)容消費并以***速度產(chǎn)生大量的數(shù)據(jù)。
本書集成了近年來社會媒體、社會網(wǎng)絡(luò)分析以及數(shù)據(jù)挖掘的前沿成果,為學(xué)生、從業(yè)者、研究人員和項目經(jīng)理提供了一個方便的平臺,以便理解社會媒體挖掘的基礎(chǔ)知識和潛能。本書介紹了社會媒體數(shù)據(jù)的問題,并闡述了網(wǎng)絡(luò)分析和數(shù)據(jù)挖掘的基本概念、新問題以及有效的算法。
書籍鏈接:http://dmml.asu.edu/smm/