近200篇機(jī)器學(xué)習(xí)&深度學(xué)習(xí)資料分享(含各種文檔,視頻,源碼等)
編者按:本文收集了百來篇關(guān)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的資料,含各種文檔,視頻,源碼等。而且原文也會不定期的更新,望看到文章的朋友能夠?qū)W到更多。
《Brief History of Machine Learning》
介紹:這是一篇介紹機(jī)器學(xué)習(xí)歷史的文章,介紹很全面,從感知機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹、SVM、Adaboost 到隨機(jī)森林、Deep Learning.
《Deep Learning in Neural Networks: An Overview》
介紹:這是瑞士人工智能實(shí)驗(yàn)室 Jurgen Schmidhuber 寫的最新版本《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)綜述》本綜述的特點(diǎn)是以時(shí)間排序,從 1940 年開始講起,到 60-80 年代,80-90 年代,一直講到 2000 年后及最近幾年的進(jìn)展。涵蓋了 deep learning 里各種 tricks,引用非常全面.
《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》
介紹:這是一份 python 機(jī)器學(xué)習(xí)庫,如果您是一位 python 工程師而且想深入的學(xué)習(xí)機(jī)器學(xué)習(xí).那么這篇文章或許能夠幫助到你.
《How to Layout and Manage Your Machine Learning Project》
介紹:這一篇介紹如果設(shè)計(jì)和管理屬于你自己的機(jī)器學(xué)習(xí)項(xiàng)目的文章,里面提供了管理模版、數(shù)據(jù)管理與實(shí)踐方法.
介紹:如果你還不知道什么是機(jī)器學(xué)習(xí),或則是剛剛學(xué)習(xí)感覺到很枯燥乏味。那么推薦一讀。這篇文章已經(jīng)被翻譯成中文,如果有興趣可以移步 http://blog.jobbole.com/67616/
介紹:R語言是機(jī)器學(xué)習(xí)的主要語言,有很多的朋友想學(xué)習(xí)R語言,但是總是忘記一些函數(shù)與關(guān)鍵字的含義。那么這篇文章或許能夠幫助到你
《Choosing a Machine Learning Classifier》
介紹:我該如何選擇機(jī)器學(xué)習(xí)算法,這篇文章比較直觀的比較了 Naive Bayes,Logistic Regression,SVM,決策樹等方法的優(yōu)劣,另外討論了樣本大小、Feature 與 Model 權(quán)衡等問題。此外還有已經(jīng)翻譯了的版本:http://www.52ml.net/15063.html
《An Introduction to Deep Learning: From Perceptrons to Deep Networks》
介紹:深度學(xué)習(xí)概述:從感知機(jī)到深度網(wǎng)絡(luò),作者對于例子的選擇、理論的介紹都很到位,由淺入深。翻譯版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html
《The LION Way: Machine Learning plus Intelligent Optimization》
介紹:<機(jī)器學(xué)習(xí)與優(yōu)化>這是一本機(jī)器學(xué)習(xí)的小冊子, 短短 300 多頁道盡機(jī)器學(xué)習(xí)的方方面面. 圖文并茂, 生動易懂, 沒有一坨坨公式的煩惱. 適合新手入門打基礎(chǔ), 也適合老手溫故而知新. 比起 MLAPP/PRML 等大部頭, 也許這本你更需要!具體內(nèi)容推薦閱讀:http://intelligent-optimization.org/LIONbook/
《深度學(xué)習(xí)與統(tǒng)計(jì)學(xué)習(xí)理論》
介紹:作者是來自百度,不過他本人已經(jīng)在 2014 年 4 月份申請離職了。但是這篇文章很不錯(cuò)如果你不知道深度學(xué)習(xí)與支持向量機(jī)/統(tǒng)計(jì)學(xué)習(xí)理論有什么聯(lián)系?那么應(yīng)該立即看看這篇文章.
《計(jì)算機(jī)科學(xué)中的數(shù)學(xué)》
介紹:這本書是由谷歌公司和 MIT 共同出品的計(jì)算機(jī)科學(xué)中的數(shù)學(xué):Mathematics for Computer Science,Eric Lehman et al 2013 。分為 5 大部分:1)證明,歸納。2)結(jié)構(gòu),數(shù)論,圖。3)計(jì)數(shù),求和,生成函數(shù)。4)概率,隨機(jī)行走。5)遞歸。等等
《信息時(shí)代的計(jì)算機(jī)科學(xué)理論(Foundations of Data Science)》
介紹:信息時(shí)代的計(jì)算機(jī)科學(xué)理論,目前國內(nèi)有紙質(zhì)書購買,iTunes 購買
介紹:這是一本由雪城大學(xué)新編的第二版《數(shù)據(jù)科學(xué)入門》教材:偏實(shí)用型,淺顯易懂,適合想學(xué)習(xí)R語言的同學(xué)選讀。
《Twenty Questions for Donald Knuth》
介紹:這并不是一篇文檔或書籍。這是篇向圖靈獎(jiǎng)得主 Donald Knuth 提問記錄稿: 近日, Charles Leiserson, Al Aho, Jon Bentley 等大神向 Knuth 提出了 20 個(gè)問題,內(nèi)容包括 TAOCP,P/NP 問題,圖靈機(jī),邏輯,以及為什么大神不用電郵等等。
《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》
介紹:不會統(tǒng)計(jì)怎么辦?不知道如何選擇合適的統(tǒng)計(jì)模型怎么辦?那這篇文章你的好好讀一讀了麻省理工 Joshua B. Tenenbaum 和劍橋 Zoubin Ghahramani 合作,寫了一篇關(guān)于 automatic statistician 的文章。可以自動選擇回歸模型類別,還能自動寫報(bào)告...
介紹:對深度學(xué)習(xí)和 representation learning 最新進(jìn)展有興趣的同學(xué)可以了解一下
《Introduction to Information Retrieval》
介紹:這是一本信息檢索相關(guān)的書籍,是由斯坦福 Manning 與谷歌副總裁 Raghavan 等合著的 Introduction to Information Retrieval 一直是北美最受歡迎的信息檢索教材之一。最近作者增加了該課程的幻燈片和作業(yè)。IR 相關(guān)資源:http://www-nlp.stanford.edu/IR-book/information-retrieval.html
《Machine learning in 10 pictures》
介紹:Deniz Yuret 用 10 張漂亮的圖來解釋機(jī)器學(xué)習(xí)重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity. 很清晰
介紹:雅虎研究院的數(shù)據(jù)集匯總: 包括語言類數(shù)據(jù),圖與社交類數(shù)據(jù),評分與分類數(shù)據(jù),計(jì)算廣告學(xué)數(shù)據(jù),圖像數(shù)據(jù),競賽數(shù)據(jù),以及系統(tǒng)類的數(shù)據(jù)。
《An Introduction to Statistical Learning with Applications in R》
介紹:這是一本斯坦福統(tǒng)計(jì)學(xué)著名教授 Trevor Hastie 和 Robert Tibshirani 的新書,并且在 2014 年一月已經(jīng)開課:https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about
Best Machine Learning Resources for Getting Started
介紹:機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總是專為機(jī)器學(xué)習(xí)初學(xué)者推薦的優(yōu)質(zhì)學(xué)習(xí)資源,幫助初學(xué)者快速入門。而且這篇文章的介紹已經(jīng)被翻譯成中文版。如果你不怎么熟悉,那么我建議你先看一看中文的介紹。
介紹:主要是順著 Bengio 的 PAMI review 的文章找出來的。包括幾本綜述文章,將近 100 篇論文,各位山頭們的 Presentation。全部都可以在 google 上找到。
Cross-Language Information Retrieval
介紹:這是一本書籍,主要介紹的是跨語言信息檢索方面的知識。理論很多
探索推薦引擎內(nèi)部的秘密,第 1 部分: 推薦引擎初探
介紹:本文共有三個(gè)系列,作者是來自 IBM 的工程師。它主要介紹了推薦引擎相關(guān)算法,并幫助讀者高效的實(shí)現(xiàn)這些算法。探索推薦引擎內(nèi)部的秘密,第 2 部分: 深度推薦引擎相關(guān)算法 - 協(xié)同過濾,探索推薦引擎內(nèi)部的秘密,第 3 部分: 深度推薦引擎相關(guān)算法 - 聚類
《Advice for students of machine learning》
介紹:康奈爾大學(xué)信息科學(xué)系助理教授 David Mimno 寫的《對機(jī)器學(xué)習(xí)初學(xué)者的一點(diǎn)建議》, 寫的挺實(shí)際,強(qiáng)調(diào)實(shí)踐與理論結(jié)合,最后還引用了馮 · 諾依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."
介紹:這是一本關(guān)于分布式并行處理的數(shù)據(jù)《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的 James L. McClelland。著重介紹了各種神級網(wǎng)絡(luò)算法的分布式實(shí)現(xiàn),做 Distributed Deep Learning 的童鞋可以參考下
介紹:【“機(jī)器學(xué)習(xí)”是什么?】John Platt 是微軟研究院杰出科學(xué)家,17 年來他一直在機(jī)器學(xué)習(xí)領(lǐng)域耕耘。近年來機(jī)器學(xué)習(xí)變得炙手可熱,Platt 和同事們遂決定開設(shè)博客,向公眾介紹機(jī)器學(xué)習(xí)的研究進(jìn)展。機(jī)器學(xué)習(xí)是什么,被應(yīng)用在哪里?來看 Platt 的這篇博文
《2014 年國際機(jī)器學(xué)習(xí)大會 ICML 2014 論文》
介紹:2014 年國際機(jī)器學(xué)習(xí)大會(ICML)已經(jīng)于 6 月 21-26 日在國家會議中心隆重舉辦。本次大會由微軟亞洲研究院和清華大學(xué)聯(lián)手主辦,是這個(gè)有著 30 多年歷史并享譽(yù)世界的機(jī)器學(xué)習(xí)領(lǐng)域的盛會首次來到中國,已成功吸引海內(nèi)外 1200 多位學(xué)者的報(bào)名參與。干貨很多,值得深入學(xué)習(xí)下
《Machine Learning for Industry: A Case Study》
介紹:這篇文章主要是以 Learning to Rank 為例說明企業(yè)界機(jī)器學(xué)習(xí)的具體應(yīng)用,RankNet 對 NDCG 之類不敏感,加入 NDCG 因素后變成了 LambdaRank,同樣的思想從神經(jīng)網(wǎng)絡(luò)改為應(yīng)用到 Boosted Tree 模型就成就了 LambdaMART。Chirs Burges,微軟的機(jī)器學(xué)習(xí)大神,Yahoo 2010 Learning to Rank Challenge 第一名得主,排序模型方面有 RankNet,LambdaRank,LambdaMART,尤其以 LambdaMART 最為突出,代表論文為: From RankNet to LambdaRank to LambdaMART: An Overview 此外,Burges 還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition
Some Notes on Applied Mathematics for Machine Learning
100 Best GitHub: Deep Learning
介紹:100 Best GitHub: Deep Learning
《UFLDL-斯坦福大學(xué) Andrew Ng 教授“Deep Learning”教程》
介紹:本教程將闡述無監(jiān)督特征學(xué)習(xí)和深度學(xué)習(xí)的主要觀點(diǎn)。通過學(xué)習(xí),你也將實(shí)現(xiàn)多個(gè)功能學(xué)習(xí)/深度學(xué)習(xí)算法,能看到它們?yōu)槟愎ぷ?,并學(xué)習(xí)如何應(yīng)用/適應(yīng)這些想法到新問題上。本教程假定機(jī)器學(xué)習(xí)的基本知識(特別是熟悉的監(jiān)督學(xué)習(xí),邏輯回歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這里機(jī)器學(xué)習(xí)課程,并先完成第 II,III,IV 章(到邏輯回歸)。此外這關(guān)于這套教程的源代碼在 github 上面已經(jīng)有 python 版本了 UFLDL Tutorial Code
*《Deep Learning for Natural Language Processing and Related Applications》
介紹:這份文檔來自微軟研究院,精髓很多。如果需要完全理解,需要一定的機(jī)器學(xué)習(xí)基礎(chǔ)。不過有些地方會讓人眼前一亮,毛塞頓開。
介紹:這是一篇介紹圖像卷積運(yùn)算的文章,講的已經(jīng)算比較詳細(xì)的了
《Machine Learning Summer School》
介紹:每天請一個(gè)大牛來講座,主要涉及機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,并行計(jì)算以及人腦研究。https://www.youtube.com/user/smolix (需FQ)
介紹:一個(gè)超級完整的機(jī)器學(xué)習(xí)開源庫總結(jié),如果你認(rèn)為這個(gè)碉堡了,那后面這個(gè)列表會更讓你驚訝:【Awesome Awesomeness】,國內(nèi)已經(jīng)有熱心的朋友進(jìn)行了翻譯中文介紹,機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘免費(fèi)電子書
介紹:ACL 候任主席、斯坦福大學(xué)計(jì)算機(jī)系 Chris Manning 教授的《自然語言處理》課程所有視頻已經(jīng)可以在斯坦福公開課網(wǎng)站上觀看了(如 Chrome 不行,可用 IE 觀看) 作業(yè)與測驗(yàn)也可以下載。
《Deep Learning and Shallow Learning》
介紹:對比 Deep Learning 和 Shallow Learning 的好文,來著浙大畢業(yè)、MIT 讀博的 Chiyuan Zhang 的博客。
《Recommending music on Spotify with deep learning》
介紹:利用卷積神經(jīng)網(wǎng)絡(luò)做音樂推薦。
《Neural Networks and Deep Learning》
介紹:神經(jīng)網(wǎng)絡(luò)的免費(fèi)在線書,已經(jīng)寫了三章了,還有對應(yīng)的開源代碼:https://github.com/mnielsen/neural-networks-and-deep-learning 愛好者的福音。
介紹:Java 機(jī)器學(xué)習(xí)相關(guān)平臺和開源的機(jī)器學(xué)習(xí)庫,按照大數(shù)據(jù)、NLP、計(jì)算機(jī)視覺和 Deep Learning 分類進(jìn)行了整理。看起來挺全的,Java 愛好者值得收藏。
《Machine Learning Theory: An Introductory Primer》
介紹:機(jī)器學(xué)習(xí)最基本的入門文章,適合零基礎(chǔ)者
介紹:機(jī)器學(xué)習(xí)的算法很多。很多時(shí)候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來的。這里,我們從兩個(gè)方面來給大家介紹,第一個(gè)方面是學(xué)習(xí)的方式,第二個(gè)方面是算法的類似性。
《機(jī)器學(xué)習(xí)經(jīng)典論文/survey 合集》
介紹:看題目你已經(jīng)知道了是什么內(nèi)容,沒錯(cuò)。里面有很多經(jīng)典的機(jī)器學(xué)習(xí)論文值得仔細(xì)與反復(fù)的閱讀。
介紹:視頻由加州理工學(xué)院(Caltech)出品。需要英語底子。
介紹:總結(jié)了機(jī)器學(xué)習(xí)的經(jīng)典書籍,包括數(shù)學(xué)基礎(chǔ)和算法理論的書籍,可做為入門參考書單。
《16 Free eBooks On Machine Learning》
介紹:16 本機(jī)器學(xué)習(xí)的電子書,可以下載下來在 pad,手機(jī)上面任意時(shí)刻去閱讀。不多我建議你看完一本再下載一本。
《A Large set of Machine Learning Resources for Beginners to Mavens》
介紹:標(biāo)題很大,從新手到專家。不過看完上面所有資料??隙ㄊ菍<伊?/p>
《機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總》
介紹:入門的書真的很多,而且我已經(jīng)幫你找齊了。
介紹:Sibyl 是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來解決預(yù)測方面的問題,比如 YouTube 的視頻推薦。
介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville 著
《Neural Network & Text Mining》
介紹:關(guān)于(Deep) Neural Networks 在 NLP 和 Text Mining 方面一些 paper 的總結(jié)
介紹:計(jì)算機(jī)視覺入門之前景目標(biāo)檢測1(總結(jié))
介紹:計(jì)算機(jī)視覺入門之行人檢測
《Deep Learning – important resources for learning and understanding》
介紹:Important resources for learning and understanding . Is awesome
《Machine Learning Theory: An Introductory Primer》
介紹:這又是一篇機(jī)器學(xué)習(xí)初學(xué)者的入門文章。值得一讀
《Neural Networks and Deep Learning》
介紹:在線 Neural Networks and Deep Learning 電子書
《Python 網(wǎng)頁爬蟲 & 文本處理 & 科學(xué)計(jì)算 & 機(jī)器學(xué)習(xí) & 數(shù)據(jù)挖掘兵器譜》
介紹:python 的 17 個(gè)關(guān)于機(jī)器學(xué)習(xí)的工具
#p#
介紹:下集在這里神奇的伽瑪函數(shù)(下)
介紹:作者王益目前是騰訊廣告算法總監(jiān),王益博士畢業(yè)后在 google 任研究。這篇文章王益博士 7 年來從谷歌到騰訊對于分布機(jī)器學(xué)習(xí)的所見所聞。值得細(xì)讀
《機(jī)器學(xué)習(xí)提升之道(Level-Up Your Machine Learning)》
介紹:把機(jī)器學(xué)習(xí)提升的級別分為0~4 級,每級需要學(xué)習(xí)的教材和掌握的知識。這樣,給機(jī)器學(xué)習(xí)者提供一個(gè)上進(jìn)的路線圖,以免走彎路。另外,整個(gè)網(wǎng)站都是關(guān)于機(jī)器學(xué)習(xí)的,資源很豐富。
介紹:機(jī)器學(xué)習(xí)各個(gè)方向綜述的網(wǎng)站
介紹:深度學(xué)習(xí)閱資源列表
《Deep Learning: Methods and Applications》
介紹:這是一本來自微的研究員 li Peng 和 Dong Yu 所著的關(guān)于深度學(xué)習(xí)的方法和應(yīng)用的電子書
《Machine Learning Summer School 2014》
介紹:2014 年七月 CMU 舉辦的機(jī)器學(xué)習(xí)夏季課剛剛結(jié)束有近 50 小時(shí)的視頻、十多個(gè) PDF 版幻燈片,覆蓋深度學(xué)習(xí),貝葉斯,分布式機(jī)器學(xué)習(xí),伸縮性等熱點(diǎn)話題。所有 13 名講師都是牛人:包括大牛 Tom Mitchell (他的[機(jī)器學(xué)習(xí)]是名校的常用教材),還有 CMU 李沐 .(1080P 高清喲)
《Sibyl: 來自 Google 的大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)》
介紹:在今年的 IEEE/IFIP 可靠系統(tǒng)和網(wǎng)絡(luò)(DSN)國際會議上,Google 軟件工程師 Tushar Chandra 做了一個(gè)關(guān)于 Sibyl 系統(tǒng)的主題演講。 Sibyl 是一個(gè)監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來解決預(yù)測方面的問題,比如 YouTube 的視頻推薦。詳情請閱讀 google sibyl
《Building a deeper understanding of images》
介紹:谷歌研究院的 Christian Szegedy 在谷歌研究院的博客上簡要地介紹了他們今年參加 ImageNet 取得好成績的 GoogLeNet 系統(tǒng).是關(guān)于圖像處理的。
《Bayesian network 與 python 概率編程實(shí)戰(zhàn)入門》
介紹:貝葉斯學(xué)習(xí)。如果不是很清可看看概率編程語言與貝葉斯方法實(shí)踐
介紹:網(wǎng)友問伯克利機(jī)器學(xué)習(xí)大牛、美國雙料院士 Michael I. Jordan:"如果你有 10 億美金,你怎么花?Jordan: "我會用這 10 億美金建造一個(gè) NASA 級別的自然語言處理研究項(xiàng)目。"
《機(jī)器學(xué)習(xí)&數(shù)據(jù)挖掘筆記_16(常見面試之機(jī)器學(xué)習(xí)算法思想簡單梳理)》
介紹:常見面試之機(jī)器學(xué)習(xí)算法思想簡單梳理
介紹:Videolectures 上最受歡迎的 25 個(gè)文本與數(shù)據(jù)挖掘視頻匯總
介紹:在 Kaggle 上經(jīng)常取得不錯(cuò)成績的 Tim Dettmers 介紹了他自己是怎么選擇深度學(xué)習(xí)的 GPUs, 以及個(gè)人如何構(gòu)建深度學(xué)習(xí)的 GPU 集群: http://t.cn/RhpuD1G
《對話機(jī)器學(xué)習(xí)大神 Michael Jordan:深度模型》
介紹:對話機(jī)器學(xué)習(xí)大神 Michael Jordan
《Deep Learning 和 Knowledge Graph 引爆大數(shù)據(jù)革命》
介紹:還有2,3 部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html
介紹:是 Stanford 教授 Andrew Ng 的 Deep Learning 教程,國內(nèi)的機(jī)器學(xué)習(xí)愛好者很熱心的把這個(gè)教程翻譯成了中文。如果你英語不好,可以看看這個(gè)
介紹:因?yàn)榻鼉赡陙?,深度學(xué)習(xí)在媒體界被炒作很厲害(就像大數(shù)據(jù))。其實(shí)很多人都還不知道什么是深度學(xué)習(xí)。這篇文章由淺入深。告訴你深度學(xué)究竟是什么!
介紹:這是斯坦福大學(xué)做的一免費(fèi)課程(很勉強(qiáng)),這個(gè)可以給你在深度學(xué)習(xí)的路上給你一個(gè)學(xué)習(xí)的思路。里面提到了一些基本的算法。而且告訴你如何去應(yīng)用到實(shí)際環(huán)境中。中文版
介紹:這是多倫多大學(xué)做的一個(gè)深度學(xué)習(xí)用來識別圖片標(biāo)簽/圖轉(zhuǎn)文字的 demo。是一個(gè)實(shí)際應(yīng)用案例。有源碼
《Deep learning from the bottom up》
介紹:機(jī)器學(xué)習(xí)模型,閱讀這個(gè)內(nèi)容需要有一定的基礎(chǔ)。
介紹: (CRAN Task Views, 34 種常見任務(wù),每個(gè)任務(wù)又各自分類列舉若干常用相關(guān)工具包) 例如: 機(jī)器學(xué)習(xí),自然語言處理,時(shí)間序列分析,空間信息分析,多重變量分析,計(jì)量經(jīng)濟(jì)學(xué),心理統(tǒng)計(jì)學(xué),社會學(xué)統(tǒng)計(jì),化學(xué)計(jì)量學(xué),環(huán)境科學(xué),藥物代謝動力學(xué)等
介紹: 機(jī)器學(xué)習(xí)無疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個(gè)熱點(diǎn)內(nèi)容。很多人在平時(shí)的工作中都或多或少會用到機(jī)器學(xué)習(xí)的算法。本文為您總結(jié)一下常見的機(jī)器學(xué)習(xí)算法,以供您在工作和學(xué)習(xí)中參考.
《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》
介紹: 很多干貨,而且作者還總結(jié)了好幾個(gè)系列。另外還作者還了一個(gè)文章導(dǎo)航.非常的感謝作者總結(jié)。
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(二)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(三)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(四)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(五)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(六)
Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(七)
DeepLearning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(八)
《Tutorials Session A - Deep Learning for Computer Vision》
介紹:傳送理由:Rob Fergus 的用深度學(xué)習(xí)做計(jì)算機(jī)是覺的 NIPS 2013 教程。有 mp4, mp3, pdf 各種下載 他是紐約大學(xué)教授,目前也在 Facebook 工作,他 2014 年的 8 篇論文
介紹:FudanNLP,這是一個(gè)復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院開發(fā)的開源中文自然語言處理(NLP)工具包 Fudan NLP 里包含中文分詞、關(guān)鍵詞抽取、命名實(shí)體識別、詞性標(biāo)注、時(shí)間詞抽取、語法分析等功能,對搜索引擎文本分析等極為有價(jià)值。
介紹:LinkedIn 開源的機(jī)器學(xué)習(xí)工具包,支持單機(jī), Hadoop cluster,和 Spark cluster 重點(diǎn)是 logistic regression 算法
介紹:對于英語不好,但又很想學(xué)習(xí)機(jī)器學(xué)習(xí)的朋友。是一個(gè)大的福利。機(jī)器學(xué)習(xí)周刊目前主要提供中文版,還是面向廣大國內(nèi)愛好者,內(nèi)容涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、并行系統(tǒng)、圖像識別、人工智能、機(jī)器人等等。謝謝作者
《線性代數(shù)》
介紹:《線性代數(shù)》是《機(jī)器學(xué)習(xí)》的重要數(shù)學(xué)先導(dǎo)課程。其實(shí)《線代》這門課講得淺顯易懂特別不容易,如果一上來就講逆序數(shù)及羅列行列式性質(zhì),很容易讓學(xué)生失去學(xué)習(xí)的興趣。我個(gè)人推薦的最佳《線性代數(shù)》課程是麻省理工 Gilbert Strang 教授的課程。 課程主頁
介紹:大數(shù)據(jù)數(shù)據(jù)處理資源、工具不完備列表,從框架、分布式編程、分布式文件系統(tǒng)、鍵值數(shù)據(jù)模型、圖數(shù)據(jù)模型、數(shù)據(jù)可視化、列存儲、機(jī)器學(xué)習(xí)等。很贊的資源匯總。
《machine learning for smart dummies》
介紹:雅虎邀請了一名來自本古里安大學(xué)的訪問學(xué)者,制作了一套關(guān)于機(jī)器學(xué)習(xí)的系列視頻課程。本課程共分為 7 期,詳細(xì)講解了有關(guān) SVM, boosting, nearest neighbors, decision trees 等常規(guī)機(jī)器學(xué)習(xí)算法的理論基礎(chǔ)知識。
《Entanglement-Based Quantum Machine Learning》
介紹:應(yīng)對大數(shù)據(jù)時(shí)代,量子機(jī)器學(xué)習(xí)的第一個(gè)實(shí)驗(yàn) paper 下載
《How a Math Genius Hacked OkCupid to Find True Love》
介紹:Wired 雜志報(bào)道了 UCLA 數(shù)學(xué)博士 Chris McKinlay (圖1)通過大數(shù)據(jù)手段+機(jī)器學(xué)習(xí)方法破解婚戀網(wǎng)站配對算法找到真愛的故事,通過 Python 腳本控制著 12 個(gè)賬號,下載了婚戀網(wǎng)站 2 萬女用戶的 600 萬問題答案,對他們進(jìn)行了統(tǒng)計(jì)抽樣及聚類分析(圖2,3),最后終于收獲了真愛??萍几淖兠\(yùn)!
介紹:MIT 的 Underactuated Robotics 于 2014 年 10 月 1 日開課,該課屬于 MIT 研究生級別的課程,對機(jī)器人和非線性動力系統(tǒng)感興趣的朋友不妨可以挑戰(zhàn)一下這門課程!
《mllib 實(shí)踐經(jīng)驗(yàn)(1)》
介紹:mllib 實(shí)踐經(jīng)驗(yàn)分享
《Google Turns To Deep Learning Classification To Fight Web Spam》
介紹:Google 用 Deep Learning 做的 antispam (反垃圾郵件)
介紹:NLP 常用信息資源* 《NLP 常用信息資源》
介紹:機(jī)器學(xué)習(xí)速查表
《Best Papers vs. Top Cited Papers in Computer Science》
介紹:從 1996 年開始在計(jì)算機(jī)科學(xué)的論文中被引用次數(shù)最多的論文
《InfiniTAM: 基于深度圖像的體數(shù)據(jù)集成框架》
介紹:把今年的一個(gè) ACM Trans. on Graphics (TOG)論文中的代碼整理為一個(gè)開源的算法框架,共享出來了。歡迎大家使用??梢詫?shí)時(shí)的采集 3D 數(shù)據(jù)、重建出三維模型。Online learning,GPU Random forest,GPU CRF 也會后續(xù)公開。
介紹:【神經(jīng)網(wǎng)絡(luò)黑客指南】現(xiàn)在,最火莫過于深度學(xué)習(xí)(Deep Learning),怎樣更好學(xué)習(xí)它?可以讓你在瀏覽器中,跑起深度學(xué)習(xí)效果的超酷開源項(xiàng)目 convnetjs 作者 karpathy 告訴你,最佳技巧是,當(dāng)你開始寫代碼,一切將變得清晰。他剛發(fā)布了一本圖書,不斷在線更新
《Building a Production Machine Learning Infrastructure》
介紹:前 Google 廣告系統(tǒng)工程師 Josh Wills 講述工業(yè)界和學(xué)術(shù)界機(jī)器學(xué)習(xí)的異同,大實(shí)話
《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》
介紹:使用 Neo4j 做電影評論的情感分析。
《DeepLearning.University – An Annotated Deep Learning Bibliography》
介紹:不僅是資料,而且還對有些資料做了注釋。
《A primer on deeping learning》
介紹:深度學(xué)習(xí)入門的初級讀本
《Machine learning is teaching us the secret to teaching 》
介紹:機(jī)器學(xué)習(xí)教會了我們什么?
《scikit-learn:用于機(jī)器學(xué)習(xí)的 Python 模塊》
介紹:scikit-learn 是在 SciPy 基礎(chǔ)上構(gòu)建的用于機(jī)器學(xué)習(xí)的 Python 模塊。
《對話機(jī)器學(xué)習(xí)大神 Michael Jordan:解析領(lǐng)域中各類模型》
介紹:喬丹教授(Michael I. Jordan)教授是機(jī)器學(xué)習(xí)領(lǐng)域神經(jīng)網(wǎng)絡(luò)的大牛,他對深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)有著很濃厚的興趣。因此,很多提問的問題中包含了機(jī)器學(xué)習(xí)領(lǐng)域的各類模型,喬丹教授對此一一做了解釋和展望。
介紹:A*搜索是人工智能基本算法,用于高效地搜索圖中兩點(diǎn)的最佳路徑, 核心是 g (n) +h(n): g (n)是從起點(diǎn)到頂點(diǎn)n的實(shí)際代價(jià),h(n)是頂點(diǎn)n到目標(biāo)頂點(diǎn)的估算代價(jià)。合集
《基于云的自然語言處理開源項(xiàng)目 FudanNLP》
介紹:本項(xiàng)目利用了 Microsoft Azure,可以在幾分種內(nèi)完成 NLP on Azure Website 的部署,立即開始對 FNLP 各種特性的試用,或者以 REST API 的形式調(diào)用 FNLP 的語言分析功能
《吳立德《概率主題模型&數(shù)據(jù)科學(xué)基礎(chǔ)》》
介紹:現(xiàn)任復(fù)旦大學(xué)首席教授、計(jì)算機(jī)軟件博士生導(dǎo)師。計(jì)算機(jī)科學(xué)研究所副所長.內(nèi)部課程
介紹:好東西的干貨真的很多
《收集從 2014 年開始深度學(xué)習(xí)文獻(xiàn)》
介紹:從硬件、圖像到健康、生物、大數(shù)據(jù)、生物信息再到量子計(jì)算等,Amund Tveit 等維護(hù)了一個(gè) DeepLearning.University 小項(xiàng)目:收集從 2014 年開始深度學(xué)習(xí)文獻(xiàn),相信可以作為深度學(xué)習(xí)的起點(diǎn),github
《EMNLP 上兩篇關(guān)于股票趨勢的應(yīng)用論文 》
介紹:EMNLP 上兩篇關(guān)于 stock trend 用到了 deep model 組織特征; Exploiting Social Relations and Sentiment for Stock Prediction 用到了 stock network。
《Bengio 組(蒙特利爾大學(xué) LISA 組)深度學(xué)習(xí)教程 》
介紹:作者是深度學(xué)習(xí)一線大牛 Bengio 組寫的教程,算法深入顯出,還有實(shí)現(xiàn)代碼,一步步展開。
《學(xué)習(xí)算法的 Neural Turing Machine 》
介紹:許多傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù)都是在學(xué)習(xí) function,不過谷歌目前有開始學(xué)習(xí)算法的趨勢。谷歌另外的這篇學(xué)習(xí) Python 程序的 Learning to Execute 也有相似之處
《Learning to Rank for Information Retrieval and Natural Language Processing》
介紹:作者是華為技術(shù)有限公司,諾亞方舟實(shí)驗(yàn)室,首席科學(xué)家的李航博士寫的關(guān)于信息檢索與自然語言處理的文章
《Rumor has it: Identifying Misinformation in Microblogs》
介紹:利用機(jī)用器學(xué)習(xí)在謠言的判別上的應(yīng)用,此外還有兩個(gè)。一個(gè)是識別垃圾與虛假信息的 paper.還有一個(gè)是網(wǎng)絡(luò)輿情及其分析技術(shù)
《R機(jī)器學(xué)習(xí)實(shí)踐》
介紹:該課程是網(wǎng)易公開課的收費(fèi)課程,不貴,超級便宜。主要適合于對利用R語言進(jìn)行機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘感興趣的人。
#p#
《大數(shù)據(jù)分析:機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化》
介紹:本章中作者總結(jié)了三代機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的演化:第一代非分布式的, 第二代工具如 Mahout 和 Rapidminer 實(shí)現(xiàn)基于 Hadoop 的擴(kuò)展,第三代如 Spark 和 Storm 實(shí)現(xiàn)了實(shí)時(shí)和迭代數(shù)據(jù)處理。BIG DATA ANALYTICS BEYOND HADOOP
介紹:講計(jì)算機(jī)視覺的四部奇書(應(yīng)該叫經(jīng)典吧)之一,另外三本是 Hartley 的《多圖幾何》、Gonzalez 的《數(shù)字圖像處理》、Rafael C.Gonzalez / Richard E.Woods 的《數(shù)字圖像處理》
《LinkedIn 最新的推薦系統(tǒng)文章 Browsemaps》
介紹:里面基本沒涉及到具體算法,但作者介紹了 CF 在 LinkedIn 的很多應(yīng)用,以及他們在做推薦過程中獲得的一些經(jīng)驗(yàn)。最后一條經(jīng)驗(yàn)是應(yīng)該監(jiān)控 log 數(shù)據(jù)的質(zhì)量,因?yàn)橥扑]的質(zhì)量很依賴數(shù)據(jù)的質(zhì)量!
《初學(xué)者如何查閱自然語言處理(NLP)領(lǐng)域?qū)W術(shù)資料》
介紹:初學(xué)者如何查閱自然語言處理(NLP)領(lǐng)域?qū)W術(shù)資料
介紹:用樹莓派和相機(jī)模塊進(jìn)行人臉識別
《利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對話系統(tǒng) 》
介紹:如何利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對話系統(tǒng)
《經(jīng)典論文 Leo Breiman:Statistical Modeling: The Two Cultures 》
介紹:Francis Bach 合作的有關(guān)稀疏建模的新綜述(書):Sparse Modeling for Image and Vision Processing,內(nèi)容涉及 Sparsity, Dictionary Learning, PCA, Matrix Factorization 等理論,以及在圖像和視覺上的應(yīng)用,而且第一部分關(guān)于 Why does the l1-norm induce sparsity 的解釋也很不錯(cuò)。
《Reproducing Kernel Hilbert Space》
介紹:RKHS 是機(jī)器學(xué)習(xí)中重要的概念,其在 large margin 分類器上的應(yīng)用也是廣為熟知的。如果沒有較好的數(shù)學(xué)基礎(chǔ),直接理解 RKHS 可能會不易。本文從基本運(yùn)算空間講到 Banach 和 Hilbert 空間,深入淺出,一共才 12 頁。
介紹:許多同學(xué)對于機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的困惑在于,數(shù)學(xué)方面已經(jīng)大致理解了,但是動起手來卻不知道如何下手寫代碼。斯坦福深度學(xué)習(xí)博士 Andrej Karpathy 寫了一篇實(shí)戰(zhàn)版本的深度學(xué)習(xí)及機(jī)器學(xué)習(xí)教程,手把手教你用 Javascript 寫神經(jīng)網(wǎng)絡(luò)和 SVM.
介紹:【語料庫】語料庫資源匯總
介紹:本文會過一遍最流行的機(jī)器學(xué)習(xí)算法,大致了解哪些方法可用,很有幫助。
《Reproducible Research in Computational Science》
介紹:這個(gè)里面有很多關(guān)于機(jī)器學(xué)習(xí)、信號處理、計(jì)算機(jī)視覺、深入學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的大量源代碼(或可執(zhí)行代碼)及相關(guān)論文??蒲袑懻撐牡暮觅Y源
《NYU 2014 年的深度學(xué)習(xí)課程資料》
介紹:NYU 2014 年的深度學(xué)習(xí)課程資料,有視頻
《計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總》
介紹:計(jì)算機(jī)視覺數(shù)據(jù)集不完全匯總
《Machine Learning Open Source Software》
介紹:機(jī)器學(xué)習(xí)開源軟件
介紹:A Library for Support Vector Machines
介紹:數(shù)據(jù)挖掘十大經(jīng)典算法之一
《100 Best GitHub: Deep Learning》
介紹:github 上面 100 個(gè)非常棒的項(xiàng)目
《加州大學(xué)歐文分校(UCI)機(jī)器學(xué)習(xí)數(shù)據(jù)集倉庫》
介紹:當(dāng)前加州大學(xué)歐文分校為機(jī)器學(xué)習(xí)社區(qū)維護(hù)著 306 個(gè)數(shù)據(jù)集。查詢數(shù)據(jù)集
介紹:Andrej Karpathy 是斯坦福大學(xué) Li Fei-Fei 的博士生,使用機(jī)器學(xué)習(xí)在圖像、視頻語義分析領(lǐng)域取得了科研和工程上的突破,發(fā)的文章不多,但每個(gè)都很扎實(shí),在每一個(gè)問題上都做到了 state-of-art.
《Andrej Karpathy 的深度強(qiáng)化學(xué)習(xí)演示》
介紹:Andrej Karpathy 的深度強(qiáng)化學(xué)習(xí)演示,論文在這里
《CIKM 數(shù)據(jù)挖掘競賽奪冠算法-陳運(yùn)文》
介紹:CIKM Cup (或者稱為 CIKM Competition)是 ACM CIKM 舉辦的國際數(shù)據(jù)挖掘競賽的名稱。
介紹:杰弗里·埃弗里斯特·辛頓 FRS 是一位英國出生的計(jì)算機(jī)學(xué)家和心理學(xué)家,以其在神經(jīng)網(wǎng)絡(luò)方面的貢獻(xiàn)聞名。辛頓是反向傳播算法和對比散度算法的發(fā)明人之一,也是深度學(xué)習(xí)的積極推動者.
《自然語言處理的深度學(xué)習(xí)理論與實(shí)際》
介紹:微軟研究院深度學(xué)習(xí)技術(shù)中心在 CIKM2014 上關(guān)于《自然語言處理的深度學(xué)習(xí)理論與實(shí)際》教學(xué)講座的幻燈片
《用大數(shù)據(jù)和機(jī)器學(xué)習(xí)做股票價(jià)格預(yù)測》
介紹: 本文基于<支持向量機(jī)的高頻限價(jià)訂單的動態(tài)建模>采用了 Apache Spark 和 Spark MLLib 從紐約股票交易所的訂單日志數(shù)據(jù)構(gòu)建價(jià)格運(yùn)動預(yù)測模型。(股票有風(fēng)險(xiǎn),投資謹(jǐn)慎) GitHub 源代碼托管地址.
《關(guān)于機(jī)器學(xué)習(xí)的若干理論問題》
介紹:徐宗本院士將于熱愛機(jī)器學(xué)習(xí)的小伙伴一起探討有關(guān)于機(jī)器學(xué)習(xí)的幾個(gè)理論性問題,并給出一些有意義的結(jié)論。最后通過一些實(shí)例來說明這些理論問題的物理意義和實(shí)際應(yīng)用價(jià)值。
《深度學(xué)習(xí)在自然語言處理的應(yīng)用》
介紹:作者還著有《這就是搜索引擎:核心技術(shù)詳解》一書,主要是介紹應(yīng)用層的東西
《Undergraduate machine learning at UBC》
介紹:機(jī)器學(xué)習(xí)課程
介紹:人臉識別必讀文章推薦
《推薦系統(tǒng)經(jīng)典論文文獻(xiàn)及業(yè)界應(yīng)用》
介紹:推薦系統(tǒng)經(jīng)典論文文獻(xiàn)
介紹:人臉識別必讀文章推薦
《第十二屆中國"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會 PPT》
介紹:第十二屆中國"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會 PPT
《統(tǒng)計(jì)機(jī)器學(xué)習(xí)》
介紹:統(tǒng)計(jì)學(xué)習(xí)是關(guān)于計(jì)算機(jī)基于數(shù)據(jù)構(gòu)建的概率統(tǒng)計(jì)模型并運(yùn)用模型對數(shù)據(jù)進(jìn)行預(yù)測和分析的一門科學(xué),統(tǒng)計(jì)學(xué)習(xí)也成為統(tǒng)計(jì)機(jī)器學(xué)習(xí)。課程來自上海交通大學(xué)
介紹:機(jī)器學(xué)習(xí)的目標(biāo)是對計(jì)算機(jī)編程,以便使用樣本數(shù)據(jù)或以往的經(jīng)驗(yàn)來解決給定的問題.
介紹:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum 的主題報(bào)告的幻燈片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin 的 Industry Track 報(bào)告的幻燈片
《人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有趣的開源項(xiàng)目》
介紹:部分中文列表
《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及 Python 實(shí)現(xiàn)--基于 SMO 的 SVM 分類器》
介紹:此外作者還有一篇元算法、AdaBoost python 實(shí)現(xiàn)文章
《Numerical Optimization: Understanding L-BFGS》
介紹:加州伯克利大學(xué)博士 Aria Haghighi 寫了一篇超贊的數(shù)值優(yōu)化博文,從牛頓法講到擬牛頓法,再講到 BFGS 以及L-BFGS, 圖文并茂,還有偽代碼。強(qiáng)烈推薦。
介紹:還有續(xù)集簡明深度學(xué)習(xí)方法概述(二)
介紹:R語言程序員私人定制版
《谷歌地圖解密:大數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合》
介紹:谷歌地圖解密
介紹:空間數(shù)據(jù)挖掘常用方法
《Use Google's Word2Vec for movie reviews》
介紹:Kaggle 新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學(xué)邊用 word2vec 和 deep learning 做 NLP“ 里面全套教程教一步一步用 python 和 gensim 包的 word2vec 模型,并在實(shí)際比賽里面比調(diào)參數(shù)和清數(shù)據(jù)。 如果已裝過 gensim 不要忘升級
介紹:PyNLPIR 提供了 NLPIR/ICTCLAS 漢語分詞的 Python 接口,此外 Zhon 提供了常用漢字常量,如 CJK 字符和偏旁,中文標(biāo)點(diǎn),拼音,和漢字正則表達(dá)式(如找到文本中的繁體字)
《深度卷積神經(jīng)網(wǎng)絡(luò)下圍棋》
介紹:這文章說把最近模型識別上的突破應(yīng)用到圍棋軟件上,打 16 萬張職業(yè)棋譜訓(xùn)練模型識別功能。想法不錯(cuò)。訓(xùn)練后目前能做到不用計(jì)算,只看棋盤就給出下一步,大約 10 級棋力。但這篇文章太過樂觀,說什么人類的最后一塊堡壘馬上就要跨掉了。話說得太早。不過,如果與別的軟件結(jié)合應(yīng)該還有潛力可挖。@萬精油墨綠
介紹:UT Austin 教授 Eric Price 關(guān)于今年 NIPS 審稿實(shí)驗(yàn)的詳細(xì)分析,他表示,根據(jù)這次實(shí)驗(yàn)的結(jié)果,如果今年 NIPS 重新審稿的話,會有一半的論文被拒。
《2014 年最佳的大數(shù)據(jù),數(shù)據(jù)科學(xué)文章》
介紹:KDNuggets 分別總結(jié)了 2014 年 14 個(gè)閱讀最多以及分享最多的文章。我們從中可以看到多個(gè)主題——深度學(xué)習(xí),數(shù)據(jù)科學(xué)家職業(yè),教育和薪酬,學(xué)習(xí)數(shù)據(jù)科學(xué)的工具比如R和 Python 以及大眾投票的最受歡迎的數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘語言
《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及 Python 實(shí)現(xiàn)--線性回歸(Linear Regression)算法》
介紹:Python 實(shí)現(xiàn)線性回歸,作者還有其他很棒的文章推薦可以看看
《2014 中國大數(shù)據(jù)技術(shù)大會 33 位核心專家演講 PDF》
介紹:2014 中國大數(shù)據(jù)技術(shù)大會 33 位核心專家演講 PDF 下載
《使用 RNN 和 Paragraph Vector 做情感分析》
介紹:這是T. Mikolov & Y. Bengio 最新論文 Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用 RNN 和 PV 在情感分析效果不錯(cuò),[項(xiàng)目代碼](https://github.com/mesnilgr/iclr15) 公布在 github (目前是空的)。這意味著 Paragraph Vector 終于揭開面紗了嘛。
《NLPIR/ICTCLAS2015 分詞系統(tǒng)大會上的技術(shù)演講 》
介紹:NLPIR/ICTCLAS2015 分詞系統(tǒng)發(fā)布與用戶交流大會上的演講,請更多朋友檢閱新版分詞吧。 我們實(shí)驗(yàn)室同學(xué)的演講包括:孫夢姝-基于評論觀點(diǎn)挖掘的商品搜索技術(shù)研究 李然-主題模型
介紹:Convex Neural Networks 解決維數(shù)災(zāi)難
介紹:介紹 CNN 參數(shù)在使用 bp 算法時(shí)該怎么訓(xùn)練,畢竟 CNN 中有卷積層和下采樣層,雖然和 MLP 的 bp 算法本質(zhì)上相同,但形式上還是有些區(qū)別的,很顯然在完成 CNN 反向傳播前了解 bp 算法是必須的。此外作者也做了一個(gè)資源集:機(jī)器學(xué)習(xí),深度學(xué)習(xí),視覺,數(shù)學(xué)等
介紹:如果要在一篇文章中匹配十萬個(gè)關(guān)鍵詞怎么辦?Aho-Corasick 算法利用添加了返回邊的 Trie 樹,能夠在線性時(shí)間內(nèi)完成匹配。 但如果匹配十萬個(gè)正則表達(dá)式呢 ? 這時(shí)候可以用到把多個(gè)正則優(yōu)化成 Trie 樹的方法,如日本人寫的 Regexp::Trie
介紹:深度學(xué)習(xí)閱讀清單
介紹:Caffe 是一個(gè)開源的深度學(xué)習(xí)框架,作者目前在 google 工作,作者主頁 Yangqing Jia (賈揚(yáng)清)
#p#
《GoogLeNet 深度學(xué)習(xí)模型的 Caffe 復(fù)現(xiàn) 》
介紹:2014 ImageNet 冠軍 GoogLeNet 深度學(xué)習(xí)模型的 Caffe 復(fù)現(xiàn)模型,GoogleNet 論文.
《LambdaNet,Haskell 實(shí)現(xiàn)的開源人工神經(jīng)網(wǎng)絡(luò)庫 》
介紹:LambdaNetLambdaNet 是由 Haskell 實(shí)現(xiàn)的一個(gè)開源的人工神經(jīng)網(wǎng)絡(luò)庫,它抽象了網(wǎng)絡(luò)創(chuàng)建、訓(xùn)練并使用了高階函數(shù)。該庫還提供了一組預(yù)定義函數(shù),用戶可以采取多種方式組合這些函數(shù)來操作現(xiàn)實(shí)世界數(shù)據(jù)。
介紹:如果你從事互聯(lián)網(wǎng)搜索,在線廣告,用戶行為分析,圖像識別,自然語言理解,或者生物信息學(xué),智能機(jī)器人,金融預(yù)測,那么這門核心課程你必須深入了解。
《楊強(qiáng)在 TEDxNanjing 談智能的起源》
介紹:"人工智能研究分許多流派。其中之一以 IBM 為代表,認(rèn)為只要有高性能計(jì)算就可得到智能,他們的‘深藍(lán)’擊敗了世界象棋冠軍;另一流派認(rèn)為智能來自動物本能;還有個(gè)很強(qiáng)的流派認(rèn)為只要找來專家,把他們的思維用邏輯一條條寫下,放到計(jì)算機(jī)里就行……" 楊強(qiáng)在 TEDxNanjing 談智能的起源
《深度 RNN/LSTM 用于結(jié)構(gòu)化學(xué)習(xí) 0) 序列標(biāo)注 Connectionist Temporal ClassificationICML06》
介紹:1) 機(jī)器翻譯 Sequence to Sequence NIPS14 2) 成分句法 GRAMMAR AS FOREIGN LANGUAGE
《Deep Learning 實(shí)戰(zhàn)之 word2vec》
介紹:網(wǎng)易有道的三位工程師寫的 word2vec 的解析文檔,從基本的詞向量/統(tǒng)計(jì)語言模型->NNLM->Log-Linear/Log-Bilinear->層次化 Log-Bilinear,到 CBOW 和 Skip-gram 模型,再到 word2vec 的各種 tricks,公式推導(dǎo)與代碼,基本上是網(wǎng)上關(guān)于 word2vec 資料的大合集,對 word2vec 感興趣的朋友可以看看
《Machine learning open source software》
介紹:機(jī)器學(xué)習(xí)開源軟件,收錄了各種機(jī)器學(xué)習(xí)的各種編程語言學(xué)術(shù)與商業(yè)的開源軟件.與此類似的還有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software, LIBSVM -- A Library for Support Vector Machines, Weka 3: Data Mining Software in Java, scikit-learn:Machine Learning in Python, Natural Language Toolkit:NLTK, MAchine Learning for LanguagE Toolkit, Data Mining - Fruitful and Fun, Open Source Computer Vision Library
《機(jī)器學(xué)習(xí)入門者學(xué)習(xí)指南》
介紹:作者是計(jì)算機(jī)研二(寫文章的時(shí)候,現(xiàn)在是 2015 年了應(yīng)該快要畢業(yè)了),專業(yè)方向自然語言處理.這是一點(diǎn)他的經(jīng)驗(yàn)之談.對于入門的朋友或許會有幫助
《A Tour of Machine Learning Algorithms》
介紹:這是一篇關(guān)于機(jī)器學(xué)習(xí)算法分類的文章,非常好
《2014 年的《機(jī)器學(xué)習(xí)日報(bào)》大合集》
介紹:機(jī)器學(xué)習(xí)日報(bào)里面推薦很多內(nèi)容,在這里有一部分的優(yōu)秀內(nèi)容就是來自機(jī)器學(xué)習(xí)日報(bào).
《 Image classification with deep learning 常用模型》
介紹:這是一篇關(guān)于圖像分類在深度學(xué)習(xí)中的文章
介紹:作者與 Bengio 的兄弟 Samy 09 年合編《自動語音識別:核方法》 3)李開復(fù) 1989 年《自動語音識別》專著,其博導(dǎo)、94 年圖靈獎(jiǎng)得主 Raj Reddy 作序
介紹: 作者是 360 電商技術(shù)組成員,這是一篇 NLP 在中文分詞中的應(yīng)用
《Using convolutional neural nets to detect facial keypoints tutorial》
介紹: 使用 deep learning 的人臉關(guān)鍵點(diǎn)檢測,此外還有一篇 AWS 部署教程
《書籍推薦:Advanced Structured Prediction》
介紹: 由 Sebastian Nowozin 等人編纂 MIT 出版的新書《Advanced Structured Prediction》http://t.cn/RZxipKG ,匯集了結(jié)構(gòu)化預(yù)測領(lǐng)域諸多牛文,涉及 CV、NLP 等領(lǐng)域,值得一讀。網(wǎng)上公開的幾章草稿:一,二,三,四,五
《An Introduction to Matrix Concentration Inequalities》
介紹: Tropp 把數(shù)學(xué)家用高深裝逼的數(shù)學(xué)語言寫的矩陣概率不等式用初等的方法寫出來,是非常好的手冊,領(lǐng)域內(nèi)的 paper 各種證明都在用里面的結(jié)果。雖說是初等的,但還是非常的難
《The free big data sources you should know》
介紹: 不容錯(cuò)過的免費(fèi)大數(shù)據(jù)集,有些已經(jīng)是耳熟能詳,有些可能還是第一次聽說,內(nèi)容跨越文本、數(shù)據(jù)、多媒體等,讓他們伴你開始數(shù)據(jù)科學(xué)之旅吧,具體包括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk 等
《A Brief Overview of Deep Learning》
介紹: 谷歌科學(xué)家、Hinton 親傳弟子 Ilya Sutskever 的深度學(xué)習(xí)綜述及實(shí)際建議
《A Deep Dive into Recurrent Neural Nets》
介紹: 非常好的討論遞歸神經(jīng)網(wǎng)絡(luò)的文章,覆蓋了 RNN 的概念、原理、訓(xùn)練及優(yōu)化等各個(gè)方面內(nèi)容,強(qiáng)烈推薦!本文作者 Nikhil Buduma 還有一篇 Deep Learning in a Nutshell 值得推薦
《機(jī)器學(xué)習(xí):學(xué)習(xí)資源》
介紹:里面融合了很多的資源,例如競賽,在線課程,demo,數(shù)據(jù)整合等。有分類
《Statistical foundations of machine learning》
介紹:《機(jī)器學(xué)習(xí)的統(tǒng)計(jì)基礎(chǔ)》在線版,該手冊希望在理論與實(shí)踐之間找到平衡點(diǎn),各主要內(nèi)容都伴有實(shí)際例子及數(shù)據(jù),書中的例子程序都是用R語言編寫的。
《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介紹:IVAN VASILEV 寫的深度學(xué)習(xí)導(dǎo)引:從淺層感知機(jī)到深度網(wǎng)絡(luò)。高可讀
《Research priorities for robust and beneficial artificial intelligence》
介紹:魯棒及有益的人工智能優(yōu)先研究計(jì)劃:一封公開信,目前已經(jīng)有 Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk 等人簽署 The Future of Life Institute (FLI).這封信的背景是最近霍金和 Elon Musk 提醒人們注意 AI 的潛在威脅。公開信的內(nèi)容是 AI 科學(xué)家們站在造福社會的角度,展望人工智能的未來發(fā)展方向,提出開發(fā) AI 系統(tǒng)的 Verification,Validity, Security, Control 四點(diǎn)要求,以及需要注意的社會問題。畢竟當(dāng)前 AI 在經(jīng)濟(jì)領(lǐng)域,法律,以及道德領(lǐng)域相關(guān)研究較少。其實(shí)還有一部美劇《疑犯追蹤》,介紹了 AI 的演進(jìn)從一開始的自我學(xué)習(xí),過濾,圖像識別,語音識別等判斷危險(xiǎn),到第四季的時(shí)候出現(xiàn)了機(jī)器通過學(xué)習(xí)成長之后想控制世界的狀態(tài)。說到這里推薦收看。
介紹:里面根據(jù)詞條提供了許多資源,還有相關(guān)知識結(jié)構(gòu),路線圖,用時(shí)長短等。號稱是”機(jī)器學(xué)習(xí)“搜索引擎
《FAIR open sources deep-learning modules for Torch》
介紹:Facebook 人工智能研究院(FAIR)開源了一系列軟件庫,以幫助開發(fā)者建立更大、更快的深度學(xué)習(xí)模型。開放的軟件庫在 Facebook 被稱作模塊。用它們替代機(jī)器學(xué)習(xí)領(lǐng)域常用的開發(fā)環(huán)境 Torch 中的默認(rèn)模塊,可以在更短的時(shí)間內(nèi)訓(xùn)練更大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。
介紹:本文雖然是寫于 2012 年,但是這篇文章完全是作者的經(jīng)驗(yàn)之作。
介紹:本文是對《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》作者 Peter Harrington 做的一個(gè)訪談。包含了書中部分的疑問解答和一點(diǎn)個(gè)人學(xué)習(xí)建議
《Deep learning from the bottom up》
介紹:非常好的深度學(xué)習(xí)概述,對幾種流行的深度學(xué)習(xí)模型都進(jìn)行了介紹和討論
《Hands-On Data Science with R Text Mining》
介紹:主要是講述了利用R語言進(jìn)行數(shù)據(jù)挖掘
介紹:幫你理解卷積神經(jīng)網(wǎng)絡(luò),講解很清晰,此外還有兩篇 Conv Nets: A Modular Perspective,Groups & Group Convolutions. 作者的其他的關(guān)于神經(jīng)網(wǎng)絡(luò)文章也很棒
《Introduction to Deep Learning Algorithms》
介紹:Deep Learning 算法介紹,里面介紹了 06 年 3 篇讓 deep learning 崛起的論文
《Learning Deep Architectures for AI》
介紹:一本學(xué)習(xí)人工智能的書籍,作者是 Yoshua Bengio,相關(guān)國內(nèi)報(bào)道
介紹:Geoffrey Hinton 是 Deep Learning 的大牛,他的主頁放了一些介紹性文章和課件值得學(xué)習(xí)
《PROBABILITY THEORY: THE LOGIC OF SCIENCE》
介紹:概率論:數(shù)理邏輯書籍
介紹:一個(gè)用來快速的統(tǒng)計(jì),機(jī)器學(xué)習(xí)并且對于數(shù)據(jù)量大的數(shù)學(xué)庫
介紹:在這里你可以看到最近深度學(xué)習(xí)有什么新動向。
《Introduction to Information Retrieval》
介紹:此書在信息檢索領(lǐng)域家喻戶曉, 除提供該書的免費(fèi)電子版外,還提供一個(gè) IR 資源列表 ,收錄了信息檢索、網(wǎng)絡(luò)信息檢索、搜索引擎實(shí)現(xiàn)等方面相關(guān)的圖書、研究中心、相關(guān)課程、子領(lǐng)域、會議、期刊等等,堪稱全集,值得收藏
【責(zé)任編輯:林師授 TEL:(010)68476606】