入行數(shù)據(jù)科學(xué),這些書一定要看
大數(shù)據(jù)已經(jīng)成為這個(gè)時(shí)代的標(biāo)志,如何理解和運(yùn)用大數(shù)據(jù),也是我們這個(gè)時(shí)代的重中之重。因此選擇一本合適的數(shù)據(jù)科學(xué)書至關(guān)重要。

近日,在GitHub上看到一張大而全的數(shù)據(jù)科學(xué)書單圖,該圖片分成七大領(lǐng)域,各自都有相對應(yīng)的推薦書單,本文就為為各位推薦幾本書,希望能夠有助于你在大數(shù)據(jù)方面的學(xué)習(xí)。
1、《數(shù)據(jù)科學(xué)入門》

本書從零開始講解數(shù)據(jù)科學(xué)工作,教授數(shù)據(jù)科學(xué)工作所必需的黑客技能,并帶領(lǐng)讀者熟悉數(shù)據(jù)科學(xué)的核心知識——數(shù)學(xué)和統(tǒng)計(jì)學(xué)。作者選擇了功能強(qiáng)大、簡單易學(xué)的Python語言環(huán)境,親手搭建工具和實(shí)現(xiàn)算法,并精心挑選了注釋良好、簡潔易讀的實(shí)現(xiàn)范例。書中涵蓋的所有代碼和數(shù)據(jù)都可以在GitHub上下載。
2、《Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking》

本書清晰易懂,適合統(tǒng)計(jì)基礎(chǔ)一般的人用來先理解ML的概念,書中涵蓋大量數(shù)據(jù)科學(xué)的概念,讀起來通俗易懂。你可以把書中大框架都理解了再去看別的更偏重理論或算法的書,
3、《貝葉斯思維》

這本書旨在幫助那些希望用數(shù)學(xué)工具解決實(shí)際問題的人們,但閱讀本書之前你***懂一點(diǎn)概率知識和程序設(shè)計(jì)。本書在共計(jì)15章的篇幅中討論了怎樣解決十幾個(gè)現(xiàn)實(shí)生活中的實(shí)際問題。在解決問題的過程中,作者還潛移默化的幫助讀者形成了建模決策的方法論,在這個(gè)意義上,這本書又是一本關(guān)于數(shù)學(xué)建模的成功樣本。
4、《數(shù)據(jù)科學(xué)實(shí)戰(zhàn)》

這本書涉及的面包含數(shù)據(jù)科學(xué)的各個(gè)層面,是相關(guān)專家客座課堂講義的分析和總結(jié),主要涵蓋以下內(nèi)容:
- 統(tǒng)計(jì)推斷、探索性數(shù)據(jù)分析(EDA)及數(shù)據(jù)科學(xué)工作流程
- 算法
- 垃圾郵件過濾、樸素貝葉斯和數(shù)據(jù)清理
- 邏輯回歸
- 金融建模
- 推薦引擎和因果關(guān)系
- 數(shù)據(jù)可視化
- 社交網(wǎng)絡(luò)與數(shù)據(jù)新聞
- 數(shù)據(jù)工程、MapReduce、Pregel和Hadoop
5、《復(fù)雜性思考》

本書提供了一系列練習(xí);這些練習(xí)都要求學(xué)生重新實(shí)現(xiàn)一些開創(chuàng)性實(shí)驗(yàn)并對其進(jìn)行擴(kuò)展。復(fù)雜性吸引人的一個(gè)地方在于我們可以通過適當(dāng)?shù)木幊碳寄芘c數(shù)學(xué)知識接觸研究前沿。
6、《統(tǒng)計(jì)思維:程序員數(shù)學(xué)之概率統(tǒng)計(jì)》

本書是一本概率統(tǒng)計(jì)方面的入門圖書,但視角極為獨(dú)特,折射出大數(shù)據(jù)浪潮的別樣風(fēng)景。作者將基本的概率統(tǒng)計(jì)知識融入Python編程,告訴你如何借助編寫程序,用計(jì)算而非數(shù)學(xué)的方式實(shí)現(xiàn)統(tǒng)計(jì)分析。
7、《利用Python進(jìn)行數(shù)據(jù)分析》

本書含有大量的實(shí)踐案例,你將學(xué)會如何利用各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數(shù)據(jù)分析問題,十分適合剛剛接觸Python的分析人員以及剛剛接觸科學(xué)計(jì)算的Python程序員。
8、《Python數(shù)據(jù)科學(xué)手冊》

本書是對以數(shù)據(jù)深度需求為中心的科學(xué)、針對計(jì)算和統(tǒng)計(jì)方法的參考書。共有五章,每章介紹一到兩個(gè)Python數(shù)據(jù)科學(xué)中的重點(diǎn)工具包。本書適合有編程背景,并打算將開源Python工具用作分析、操作、可視化以及學(xué)習(xí)數(shù)據(jù)的數(shù)據(jù)科學(xué)研究人員。
9、《Advanced and Multivariate Statistical Methods》

這是一本關(guān)于數(shù)據(jù)挖掘書籍,書中介紹了多種多元統(tǒng)計(jì)方法。