沒(méi)看過(guò)這8本書(shū),好意思說(shuō)自己從事計(jì)算機(jī)視覺(jué)?
計(jì)算機(jī)視覺(jué)是人工智能的一個(gè)子領(lǐng)域,主要專注于數(shù)字圖像(如照片和視頻)等方面的內(nèi)容,深度學(xué)習(xí)在在挑戰(zhàn)計(jì)算機(jī)視覺(jué)任務(wù)方面取得了很大的進(jìn)展。
深入探討深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺(jué)中的應(yīng)用之前,你需要具備計(jì)算機(jī)視覺(jué)基礎(chǔ),諸如掌握基礎(chǔ)的理論知識(shí),常用的技術(shù),API標(biāo)準(zhǔn)和基本數(shù)據(jù)處理
本文,我們將和大家推薦幾本備受歡迎的計(jì)算機(jī)視覺(jué)相關(guān)的較好教科書(shū)以及最適合程序員閱讀的計(jì)算機(jī)視覺(jué)書(shū)籍:
較好的計(jì)算機(jī)視覺(jué)教科書(shū)
教科書(shū)是由專家(通常是學(xué)者)編寫(xiě)的書(shū)籍,旨在作為學(xué)生和實(shí)踐者的參考。它們主要關(guān)注一般方法和理論(數(shù)學(xué)),而不是實(shí)際問(wèn)題的關(guān)注點(diǎn)和方法的應(yīng)用(代碼)。
根據(jù)它們?cè)陧敿鈱W(xué)校(如麻省理工等)大學(xué)課程中的使用情況,列出了排名前五的教科書(shū):
1. 《計(jì)算機(jī)視覺(jué)》
本書(shū)的PDF版本可以在其官網(wǎng)免費(fèi)獲得。
我非常喜歡這本書(shū),它幫助計(jì)算機(jī)視覺(jué)技術(shù)的初學(xué)者(本科生)學(xué)會(huì)解決各種基礎(chǔ)的計(jì)算機(jī)視覺(jué)問(wèn)題,是根據(jù)理查德多年在華盛頓大學(xué)教授這一課題的經(jīng)驗(yàn)寫(xiě)成的。
這本書(shū)也反映了我在企業(yè)研究實(shí)驗(yàn)室從事計(jì)算機(jī)視覺(jué)研究的20年經(jīng)驗(yàn),因此,本書(shū)更多地強(qiáng)調(diào)在實(shí)際工作中的基本技術(shù),而較少關(guān)注實(shí)際適用性較差的深?yuàn)W數(shù)學(xué)。
下載地址:http://szeliski.org/Book/
2. 《Computer Vision: Models, Learning, and Inference》
本書(shū)依然可以在其官網(wǎng)下載PDF版本。
這是一本很好的入門(mén)書(shū)(為學(xué)生),涵蓋了廣泛的計(jì)算機(jī)視覺(jué)技術(shù)和問(wèn)題。這本書(shū)花了較多的篇幅來(lái)介紹計(jì)算機(jī)視覺(jué),并在概率建模相關(guān)的基礎(chǔ)主題上花了大量的篇幅
本書(shū)更注重學(xué)習(xí)和推理的概率模型,它展示了如何使用訓(xùn)練數(shù)據(jù)來(lái)學(xué)習(xí)觀察到的圖像數(shù)據(jù)與我們現(xiàn)實(shí)世界之間的關(guān)系,例如3D結(jié)構(gòu)或?qū)ο箢?,本?shū)從概率論和模型擬合的基礎(chǔ)開(kāi)始,直至讀者可以實(shí)現(xiàn)和修改真實(shí)示例,以構(gòu)建有用的視覺(jué)系統(tǒng)。主要針對(duì)高級(jí)本科和研究生,
下載地址:http://www.computervisionmodels.com/
3. 《計(jì)算機(jī)視覺(jué):一種現(xiàn)代方法》
這是一本關(guān)于計(jì)算機(jī)視覺(jué)的入門(mén)教材,它的主題可能比其他許多教科書(shū)都要廣泛。盡管內(nèi)容廣泛,但它可能不如其他一些介紹性文本受歡迎,因?yàn)樗苯舆M(jìn)入主題的敘述方式可能更具有挑戰(zhàn)性。
本書(shū)內(nèi)容涉及幾何攝像模型、光照和著色、色彩、線性濾波、局部圖像特征、紋理、立體相對(duì)、運(yùn)動(dòng)結(jié)構(gòu)、聚類分割、組合與模型擬合、追蹤、配準(zhǔn)、平滑表面與骨架、距離數(shù)據(jù)、圖像分類、對(duì)象檢測(cè)與識(shí)別、基于圖像的建模與渲染、人形研究、圖像搜索與檢索、優(yōu)化技術(shù)等內(nèi)容。
4. 《Introductory Techniques for 3-D Computer Vision》
這是一本較老的書(shū),主要關(guān)注計(jì)算機(jī)視覺(jué),也有一些關(guān)注與3D視覺(jué)相關(guān)的技術(shù),是對(duì)現(xiàn)代計(jì)算機(jī)視覺(jué)問(wèn)題和解決方案的實(shí)用介紹。這是一個(gè)很好的起點(diǎn),適合本科生而不是研究生水平的讀者。
5. 《Multiple View Geometry in Computer Vision》
本書(shū)的部分章節(jié)可以從官網(wǎng)上下載PDF版本。
這本書(shū)在計(jì)算機(jī)視覺(jué)方面是相當(dāng)先進(jìn)的,適合研究生水平的人閱讀,特別是從多幅圖像中推斷幾何的問(wèn)題和方法。
本書(shū)分為六個(gè)部分,并有七個(gè)簡(jiǎn)短的附錄。有人說(shuō)搞計(jì)算機(jī)視覺(jué)的沒(méi)讀過(guò)都不好意思說(shuō)自己搞計(jì)算機(jī)視覺(jué)的
下載地址:http://www.robots.ox.ac.uk/~vgg/hzbook/
適合程序員的計(jì)算機(jī)視覺(jué)書(shū)籍
程序員書(shū)籍是由專家(通常是開(kāi)發(fā)人員和工程師)編寫(xiě)的(例如O 'Reilly書(shū)籍),它們主要關(guān)注技術(shù)和解決問(wèn)題的實(shí)際問(wèn)題,并關(guān)注示例代碼和標(biāo)準(zhǔn)庫(kù)。技術(shù)可以用相關(guān)的理論(數(shù)學(xué))簡(jiǎn)單地描述,但不是用作主要參考。
6. 《學(xué)習(xí)OpenCV(中文版)》
這本書(shū)的重點(diǎn)是教你如何使用OpenCV庫(kù),它可能第一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)庫(kù)。所有代碼示例都是用c++編寫(xiě)的,更重要的是,作者是OpenCV的董事會(huì)成員和創(chuàng)始人。
它是一本技術(shù)書(shū)籍,但像是一本精心編寫(xiě)的API文檔,本書(shū)提供了c++開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù)OpenCV 3的使用指南。并給出了計(jì)算機(jī)視覺(jué)領(lǐng)域的基礎(chǔ)背景知識(shí),幫助讀者更有效地使用OpenCV。
7. 《Python計(jì)算機(jī)視覺(jué)編程》
這是一本實(shí)踐性書(shū)籍,主要教你如何用Python執(zhí)行基本的計(jì)算機(jī)視覺(jué)任務(wù),主要是用PIL,不過(guò)也有關(guān)于OpenCV的基本介紹。
書(shū)中過(guò)大量示例細(xì)致分析了對(duì)象識(shí)別、基于內(nèi)容的圖像搜索、光學(xué)字符識(shí)別、光流法、跟蹤、三維重建、立體成像、增強(qiáng)現(xiàn)實(shí)、姿態(tài)估計(jì)、全景創(chuàng)建、圖像分割、降噪、圖像分組等技術(shù)。
下載地址:http://programmingcomputervision.com/
8. 《Practical Computer Vision With SimpleCV》
本書(shū)教你如何使用Python中的SimpleCV庫(kù)執(zhí)行基本的計(jì)算機(jī)視覺(jué)操作。SimpleCV是一個(gè)用Python編寫(xiě)的開(kāi)源框架,是PIL (Pillow)/OpenCV很好的替代方案。
本書(shū)通過(guò)實(shí)際例子,教你如何使用SimpleCV快速輕松地構(gòu)建自己的計(jì)算機(jī)視覺(jué)(CV)應(yīng)用程序,同時(shí)向你介紹了收集、處理和分析流媒體數(shù)字圖像的基本CV技術(shù)。