自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

吐血整理!絕不能錯(cuò)過的24個(gè)Python庫

開發(fā) 后端 開發(fā)工具
由于Python庫種類很多,要跟上其發(fā)展速度非常困難。因此,本文介紹了24種涵蓋端到端數(shù)據(jù)科學(xué)生命周期的Python庫。

Python有以下三個(gè)特點(diǎn):

  • 易用性和靈活性
  • 全行業(yè)高接受度:Python無疑是業(yè)界最流行的數(shù)據(jù)科學(xué)語言
  • 用于數(shù)據(jù)科學(xué)的Python庫的數(shù)量優(yōu)勢

事實(shí)上,由于Python庫種類很多,要跟上其發(fā)展速度非常困難。因此,本文介紹了24種涵蓋端到端數(shù)據(jù)科學(xué)生命周期的Python庫。

文中提及了用于數(shù)據(jù)清理、數(shù)據(jù)操作、可視化、構(gòu)建模型甚至模型部署(以及其他用途)的庫。這是一個(gè)相當(dāng)全面的列表,有助于你使用Python開啟數(shù)據(jù)科學(xué)之旅。

Python

用于數(shù)據(jù)收集的Python庫

你是否曾遇到過這樣的情況:缺少解決問題的數(shù)據(jù)?這是數(shù)據(jù)科學(xué)中一個(gè)永恒的問題。這也是為什么學(xué)習(xí)提取和收集數(shù)據(jù)對數(shù)據(jù)科學(xué)家來說是一項(xiàng)非常重要的技能。數(shù)據(jù)提取和收集開辟了前所未有的道路。

以下是三個(gè)用于提取和收集數(shù)據(jù)的Python庫:

1. Beautiful Soup

傳送門:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

收集數(shù)據(jù)的最佳方式之一就是抓取網(wǎng)站(當(dāng)然是以合乎道德和法律的手段!)徒手做這件事需要耗費(fèi)大量的勞動(dòng)和時(shí)間。Beautiful Soup無疑是一大救星。

Beautiful Soup是一個(gè)HTML和XML解析器,可為被解析的頁面創(chuàng)建解析樹,從而用于從web頁面中提取數(shù)據(jù)。從網(wǎng)頁中提取數(shù)據(jù)的過程稱為網(wǎng)頁抓取。

使用以下代碼可安裝BeautifulSoup:

  1. pip install beautifulsoup4 

下面是一個(gè)可實(shí)現(xiàn)從HTML中提取所有錨標(biāo)記的Beautiful Soup簡單代碼:

  1. #!/usr/bin/python3 
  2. # Anchor extraction from html document 
  3. from bs4 import BeautifulSoup 
  4. from urllib.request import urlopen 
  5.  
  6. with urlopen('LINK') as response: 
  7.     soup = BeautifulSoup(response, 'html.parser') 
  8.     for anchor in soup.find_all('a'): 
  9.         print(anchor.get('href', '/')) 

建議閱讀下面的文章,學(xué)習(xí)如何在Python中使用Beautiful Soup:

《新手指南:在Python中使用BeautifulSoup進(jìn)行網(wǎng)頁抓取》傳送門:

https://www.analyticsvidhya.com/blog/2015/10/beginner-guide-web-scraping-beautiful-soup-python/

2. Scrapy

傳送門:https://docs.scrapy.org/en/latest/intro/tutorial.html

Scrapy是另一個(gè)可有效用于網(wǎng)頁抓取的Python庫。它是一個(gè)開源的協(xié)作框架,用于從網(wǎng)站中提取所需數(shù)據(jù)。使用起來快捷簡單。

下面是用于安裝Scrapy的代碼:

  1. pip install scrapy 

Scrapy是一個(gè)用于大規(guī)模網(wǎng)頁抓取的框架??商峁┧行枰墓ぞ哂行У貜木W(wǎng)站中抓取數(shù)據(jù),且依需要處理數(shù)據(jù),并以使用者偏好的結(jié)構(gòu)和格式存儲(chǔ)數(shù)據(jù)。

下面是一個(gè)實(shí)現(xiàn)Scrapy的簡單代碼:

  1. import scrapy 
  2.  
  3. class Spider(scrapy.Spider): 
  4.     name = 'NAME' 
  5.     start_urls = ['LINK'] 
  6.  
  7.     def parse(self, response): 
  8.         for title in response.css('.post-header>h2'): 
  9.             yield {'title': title.css('a ::text').get()} 
  10.  
  11.         for next_page in response.css('a.next-posts-link'): 
  12.             yield response.follow(next_page, self.parse 

下面是一個(gè)學(xué)習(xí)Scrapy并在Python中實(shí)現(xiàn)Scrapy的絕佳教程:

《使用Scrapy在Python中進(jìn)行網(wǎng)頁抓取(含多個(gè)示例)》傳送門:

https://www.analyticsvidhya.com/blog/2017/07/web-scraping-in-python-using-scrapy/

3. Selenium

傳送門:https://www.seleniumhq.org/

Selenium是一個(gè)倍受歡迎的自動(dòng)化瀏覽器工具。在業(yè)界常用于測試,但對于網(wǎng)頁抓取也非常方便。Selenium在IT領(lǐng)域非常流行。

編寫Python腳本來自動(dòng)化使用Selenium的web瀏覽器是很容易的。它允許免費(fèi)高效地提取數(shù)據(jù),并將其存儲(chǔ)在首選格式中以備后用。

關(guān)于使用Python和Selenium抓取YouTube視頻數(shù)據(jù)的文章:

《數(shù)據(jù)科學(xué)項(xiàng)目:使用Python和Selenium抓取YouTube數(shù)據(jù)對視頻進(jìn)行分類》傳送門:

https://www.analyticsvidhya.com/blog/2019/05/scraping-classifying-youtube-video-data-python-selenium/

用于數(shù)據(jù)清理和數(shù)據(jù)操作的Python庫

收集了數(shù)據(jù)之后,接下來要清理可能面臨的任何混亂數(shù)據(jù),并學(xué)習(xí)如何操作數(shù)據(jù),方便數(shù)據(jù)為建模做好準(zhǔn)備。

下面是四個(gè)可用于數(shù)據(jù)清理和數(shù)據(jù)操作的Python庫。請記住,文中僅指明在現(xiàn)實(shí)世界中處理結(jié)構(gòu)化(數(shù)值)數(shù)據(jù)和文本數(shù)據(jù)(非結(jié)構(gòu)化)——而該庫列表涵蓋了所有內(nèi)容。

4. Pandas

傳送門:https://pandas.pydata.org/pandas-docs/stable/

在數(shù)據(jù)操作和數(shù)據(jù)分析方面,Pandas絕無敵手。Pandas一度是最流行的Python庫。Pandas是用Python語言編寫的,主要用于數(shù)據(jù)操作和數(shù)據(jù)分析。

這個(gè)名稱來源于術(shù)語“面板數(shù)據(jù)”,“面板數(shù)據(jù)”是一個(gè)計(jì)量經(jīng)濟(jì)學(xué)術(shù)語,指的是包含同一個(gè)人在多個(gè)時(shí)間段內(nèi)的觀察結(jié)果的數(shù)據(jù)集。

Pandas在Python or Anaconda中已完成預(yù)安裝,但以防需要,安裝代碼如下:

  1. pip install pandas 

Pandas有以下特點(diǎn):

  • 數(shù)據(jù)集連接和合并
  • 刪除和插入數(shù)據(jù)結(jié)構(gòu)列
  • 數(shù)據(jù)過濾
  • 重塑數(shù)據(jù)集
  • 使用DataFrame對象來操作數(shù)據(jù)等

下面是一篇文章以及一份很棒的Cheatsheet,有助于使Pandas技能達(dá)標(biāo):

  • 《Python中用于數(shù)據(jù)操作的12種有用的Pandas技術(shù)》傳送門:https://www.analyticsvidhya.com/blog/2016/01/12-pandas-techniques-python-data-manipulation/
  • 《CheatSheet:在Python中使用Pandas進(jìn)行數(shù)據(jù)探索》傳送門:https://www.analyticsvidhya.com/blog/2015/07/11-steps-perform-data-analysis-pandas-python/

5. PyOD

傳送門:https://pyod.readthedocs.io/en/latest/

難以發(fā)現(xiàn)異常值?這絕非個(gè)例。別擔(dān)心,PyOD庫就在這里。

PyOD是一個(gè)全面的、可伸縮的Python工具包,用于檢測外圍對象。離群值檢測基本上是識別與大多數(shù)數(shù)據(jù)顯著不同的稀有項(xiàng)或觀測值。

以下代碼可用于下載pyOD:

  1. pip install pyod 

PyOD是如何工作的?如何實(shí)現(xiàn)PyOD?下面一則指南將回答所有關(guān)于PyOD的問題:

《學(xué)習(xí)在Python中使用PyOD庫檢測異常值的絕佳教程》傳送門:

https://www.analyticsvidhya.com/blog/2019/02/outlier-detection-python-pyod/

6. NumPy

傳送門:https://www.numpy.org/

與Pandas一樣,NumPy也是一個(gè)非常受歡迎的Python庫。NumPy引入了支持大型多維數(shù)組和矩陣的函數(shù),同時(shí)還引入了高級數(shù)學(xué)函數(shù)來處理這些數(shù)組和矩陣。

NumPy是一個(gè)開源庫,有多方貢獻(xiàn)者。在 Anaconda和Python中已預(yù)安裝Numpy,但以防需要,下面是安裝代碼:

  1. $ pip install numpy 

下面是使用NumPy可執(zhí)行的一些基本功能:

創(chuàng)建數(shù)組:

  1. import numpy as np 
  2. x = np.array([1, 2, 3]) 
  3. print(x) 
  4. y = np.arange(10) 
  5. print(y) 
  1. output - [1 2 3] 
  2.          [0 1 2 3 4 5 6 7 8 9] 

基本運(yùn)算:

  1. a = np.array([1, 2, 3, 6]) 
  2. b = np.linspace(0, 2, 4) 
  3. c = a - b 
  4. print(c) 
  5. print(a**2) 
  1. output - [1. 1.33333333 1.66666667 4. ] 
  2.          [ 1 4 9 36] 

以及更多其他功能!

7. SpaCy

傳送門:https://spacy.io/

目前已經(jīng)討論了如何清理數(shù)據(jù)和處理數(shù)值數(shù)據(jù)。但是如果正在處理文本數(shù)據(jù)呢?到目前為止,現(xiàn)有的庫都無法解決該問題。

Spacy是一個(gè)非常有用且靈活的自然語言處理( NLP )庫和框架,用于清理創(chuàng)建模型的文本文檔。與類似用途的其他庫相比,SpaCy速度更快。

在Linux中安裝Spacy:

  1. pip install -U spacy 
  2. python -m spacy download en 

其他操作系統(tǒng)上安裝Spacy,請點(diǎn)擊:https://spacy.io/usage

以下是學(xué)習(xí)spaCy的課程:

《簡化自然語言處理——使用SpaCy(在Python中)》傳送門:

https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-spacy-%e2%80%8bin-python/

用于數(shù)據(jù)可視化的Python庫

下一步是什么呢?數(shù)據(jù)可視化!此處假設(shè)已得到驗(yàn)證,并且發(fā)掘了隱藏的觀點(diǎn)和模式。

下面是三個(gè)用于數(shù)據(jù)可視化的絕佳Python庫。

8. Matplotlib

傳送門:https://matplotlib.org/

Matplotlib是Python中最流行的數(shù)據(jù)可視化庫。允許生成和構(gòu)建各種各樣的圖。Matplotlib是筆者的首選庫,可與Seaborn一起用于進(jìn)行數(shù)據(jù)可視化研究。

以下是安裝Matplotli的代碼:

  1. $ pip install matplotlib 

下面是使用Matplotlib構(gòu)建的不同類型圖示的部分例子:

柱狀圖:

  1. %matplotlib inline 
  2. import matplotlib.pyplot as plt 
  3. from numpy.random import normal 
  4. x = normal(size=100
  5. plt.hist(x, bins=20
  6. plt.show() 

3D 圖表:

  1. from matplotlib import cm 
  2. from mpl_toolkits.mplot3d import Axes3D 
  3. import matplotlib.pyplot as plt 
  4. import numpy as np 
  5. fig = plt.figure() 
  6. ax = fig.gca(projection='3d'
  7. X = np.arange(-10, 10, 0.1) 
  8. Y = np.arange(-10, 10, 0.1) 
  9. X, Y = np.meshgrid(X, Y) 
  10. R = np.sqrt(X**2 + Y**2) 
  11. Z = np.sin(R) 
  12. surf = ax.plot_surface(X, Y, Z, rstride=1,cstride=1cmcmap=cm.coolwarm) 
  13. plt.show() 

目前已經(jīng)介紹了Pandas、NumPy和Matplotlib,那么請查看下面的教程,該教程結(jié)合了以上三個(gè)庫進(jìn)行講解:

《使用NumPy、Matplotlib和Pandas在Python中進(jìn)行數(shù)據(jù)探索的終極指南》傳送門:

https://www.analyticsvidhya.com/blog/2015/04/comprehensive-guide-data-exploration-sas-using-python-numpy-scipy-matplotlib-pandas/

9. Seaborn

傳送門:https://seaborn.pydata.org/

Seaborn是另一個(gè)基于matplotlib的繪圖庫。它是一個(gè)為繪制有吸引力的圖像而提供高級接口的python庫。matplotlib能實(shí)現(xiàn)功能,Seaborn只是以另一種更吸引人的視覺方式來實(shí)現(xiàn)。

Seaborn 的一些特點(diǎn):

  • 作為一個(gè)面向數(shù)據(jù)集的API,可用于查驗(yàn)多個(gè)變量之間的關(guān)系
  • 便于查看復(fù)雜數(shù)據(jù)集的整體結(jié)構(gòu)
  • 用于選擇顯示數(shù)據(jù)中模式的調(diào)色板的工具

下面一行代碼可用于安裝Seaborn:

  1. pip install seaborn 

瀏覽下面這些很酷的圖表,看看seaborn能做些什么:

  1. import seaborn as sns 
  2. sns.set() 
  3. tips =sns.load_dataset("tips") 
  4. sns.relplot(x="total_bill",y="tip"col="time"
  5.             hue="smoker",style="smoker"size="size"
  6.             data=tips); 

下面是另外一個(gè)例子:

  1. import seaborn as sns 
  2. sns.catplot(x="day",y="total_bill"hue="smoker"
  3.             kind="violin",split=Truedata=tips); 

10. Bokeh

傳送門:https://bokeh.pydata.org/en/latest/

Bokeh是一個(gè)面向現(xiàn)代網(wǎng)頁瀏覽器的交互式可視化庫,為大量數(shù)據(jù)集提供優(yōu)美的通用圖形結(jié)構(gòu)。

Bokeh可用于創(chuàng)建交互式繪圖、儀表板和數(shù)據(jù)應(yīng)用程序。

安裝:

  1. pip install bokeh 

了解更多關(guān)于Bokeh的知識及其實(shí)際應(yīng)用:

《使用Bokeh的交互式數(shù)據(jù)可視化(在Python中)》傳送門:

https://www.analyticsvidhya.com/blog/2015/08/interactive-data-visualization-library-python-bokeh/

用于建模的Python庫

現(xiàn)在到了本文最令人期待的部分——建模!這也是大多數(shù)人一開始接觸數(shù)據(jù)科學(xué)的原因。

接下來通過這三個(gè)Python庫來探索建模。

11. Scikit-learn

傳送門:https://scikit-learn.org/stable/

就像用于數(shù)據(jù)操作的Pandas和用于可視化的matplotlib一樣,scikit-learn是Python構(gòu)建模型中的佼佼者。沒有什么能與之媲美。

事實(shí)上,scikit-learn建立在NumPy,SciPy和matplotlib之上。它是開放源碼的,每個(gè)人都可以訪問,并且可以在各種環(huán)境中重用。

Scikit-learn支持在機(jī)器學(xué)習(xí)中執(zhí)行的不同操作,如分類、回歸、聚類和模型選擇等。命名它——那么scikit-learn會(huì)有一個(gè)模塊。

建議瀏覽以下鏈接以了解有關(guān)scikit-learn的更多信息:

《Python中的Scikit-learn——筆者去年學(xué)到的最重要的機(jī)器學(xué)習(xí)工具!》傳送門:

https://www.analyticsvidhya.com/blog/2015/01/scikit-learn-python-machine-learning-tool/

12. TensorFlow

傳送門:https://www.tensorflow.org/

TensorFlow由谷歌開發(fā),是一個(gè)流行的深度學(xué)習(xí)庫,可幫助構(gòu)建、培訓(xùn)不同模型。是一個(gè)開放源碼的端到端平臺。TensorFlow提供簡單的模型構(gòu)建,強(qiáng)大的機(jī)器學(xué)習(xí)生產(chǎn),以及強(qiáng)大的實(shí)驗(yàn)工具和庫。

TensorFlow提供多個(gè)抽象級別,可根據(jù)需要進(jìn)行選擇。TensorFlow通過使用高級Keras API來構(gòu)建和訓(xùn)練模型,這使TensorFlow入門和機(jī)器學(xué)習(xí)變得容易。

安裝傳送門:https://www.tensorflow.org/install

使用TensorFlow從閱讀這些文章開始:

  • 《TensorFlow 101:理解張量和圖像以便開始深入學(xué)習(xí)》傳送門:https://www.analyticsvidhya.com/blog/2017/03/tensorflow-understanding-tensors-and-graphs/
  • 《開始使用Keras和TensorFlow在R中進(jìn)行深度學(xué)習(xí)》傳送門:https://www.analyticsvidhya.com/blog/2017/06/getting-started-with-deep-learning-using-keras-in-r/

13. PyTorch

傳送門:https://pytorch.org/

什么是PyTorch?其實(shí),這是一個(gè)基于Python的科學(xué)計(jì)算包,其功能如下:

  • NumPy的替代品,可使用GPU的強(qiáng)大功能
  • 深度學(xué)習(xí)研究型平臺,擁有最大靈活性和最快速度

安裝指南傳送門:https://pytorch.org/get-started/locally/

PyTorch提供以下功能:

  • 混合前端
  • 工具和庫:由研發(fā)人員組成的活躍社區(qū)已經(jīng)建立了一個(gè)豐富的工具和庫的生態(tài)系統(tǒng),用于擴(kuò)展PyTorch并支持計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)等領(lǐng)域的開發(fā)
  • 云支持:PyTorch支持在主要的云平臺上運(yùn)行,通過預(yù)構(gòu)建的映像、對GPU的大規(guī)模訓(xùn)練、以及在生產(chǎn)規(guī)模環(huán)境中運(yùn)行模型的能力等,可提供無摩擦的開發(fā)和輕松拓展

以下是兩篇有關(guān)PyTorch的十分詳細(xì)且易于理解的文章:

  • 《PyTorch簡介——一個(gè)簡單但功能強(qiáng)大的深度學(xué)習(xí)庫》傳送門:https://www.analyticsvidhya.com/blog/2018/02/pytorch-tutorial/
  • 《開始使用PyTorch——學(xué)習(xí)如何建立快速和準(zhǔn)確的神經(jīng)網(wǎng)絡(luò)(以4個(gè)案例研究為例)》傳送門:https://www.analyticsvidhya.com/blog/2019/01/guide-pytorch-neural-networks-case-studies/

用于數(shù)據(jù)解釋性的Python庫

你真的了解模型如何工作嗎?能解釋模型為什么能夠得出結(jié)果嗎?這些是每個(gè)數(shù)據(jù)科學(xué)家都能夠回答的問題。構(gòu)建黑盒模型在業(yè)界毫無用處。

所以,上文中已經(jīng)提到的兩個(gè)Python庫可以幫助解釋模型的性能。

14. LIME

傳送門:https://github.com/marcotcr/lime

LIME是一種算法(庫),可以解釋任何分類器或回歸量的預(yù)測。LIME是如何做到的呢?通過可解釋的模型在局部不斷接近預(yù)測值,這個(gè)模型解釋器可用于生成任何分類算法的解釋。

安裝LIME很簡單:

  1. pip install lime 

下文將從總體上幫助開發(fā)LIME背后的直覺和模型可解釋性:

《在機(jī)器學(xué)習(xí)模型中建立信任(在Python中使用LIME)》傳送門:

https://www.analyticsvidhya.com/blog/2017/06/building-trust-in-machine-learning-models/

15. H2O

傳送門:https://github.com/h2oai/mli-resources

相信很多人都聽說過H2O.ai,自動(dòng)化機(jī)器學(xué)習(xí)的市場領(lǐng)導(dǎo)者。但是你知道其在Python中也有一個(gè)模型可解釋性庫嗎?

H2O的無人駕駛AI,提供簡單的數(shù)據(jù)可視化技術(shù),用于表示高度特征交互和非線性模型行為,通過可視化提供機(jī)器學(xué)習(xí)可解釋性(MLI),說明建模結(jié)果和模型中特征的影響。

通過下文,閱讀有關(guān)H2O的無人駕駛AI執(zhí)行MLI的更多信息。

《機(jī)器學(xué)習(xí)可解釋性》傳送門:

https://www.h2o.ai/wp-content/uploads/2018/01/Machine-Learning-Interpretability-MLI_datasheet_v4-1.pdf

用于音頻處理的Python庫

音頻處理或音頻分析是指從音頻信號中提取信息和含義以進(jìn)行分析、分類或任何其他任務(wù)。這正在成為深度學(xué)習(xí)中的一種流行功能,所以要留意這一點(diǎn)。

16. LibROSA

傳送門:https://librosa.github.io/librosa/

LibROSA是一個(gè)用于音樂和音頻分析的Python庫。它提供了創(chuàng)建音樂信息檢索系統(tǒng)所需的構(gòu)建塊。

安裝指南傳送門:https://librosa.github.io/librosa/install.html

這是一篇關(guān)于音頻處理及其工作原理的深度文章:

《利用深度學(xué)習(xí)開始音頻數(shù)據(jù)分析(含案例研究)》傳送門:

https://www.analyticsvidhya.com/blog/2017/08/audio-voice-processing-deep-learning/

17. Madmom

傳送門:https://github.com/CPJKU/madmom

Madmom是一個(gè)用于音頻數(shù)據(jù)分析的很棒的Python庫。它是一個(gè)用Python編寫的音頻信號處理庫,主要用于音樂信息檢索(MIR)任務(wù)。

以下是安裝Madmom的必備條件:

  • NumPy
  • SciPy
  • Cython
  • Mido

以下軟件包用于測試安裝:

  • PyTest
  • Fyaudio
  • PyFftw

安裝Madmom的代碼:

  1. pip install madmom 

下文可用以了解Madmom如何用于音樂信息檢索:

《學(xué)習(xí)音樂信息檢索的音頻節(jié)拍追蹤(使用Python代碼)》傳送門:

https://www.analyticsvidhya.com/blog/2018/02/audio-beat-tracking-for-music-information-retrieval/

18. pyAudioAnalysis

傳送門:https://github.com/tyiannak/pyAudioAnalysis

pyAudioAnalysis是一個(gè)用于音頻特征提取、分類和分段的Python庫,涵蓋廣泛的音頻分析任務(wù),例如:

  • 對未知聲音進(jìn)行分類
  • 檢測音頻故障并排除長時(shí)間錄音中的靜音時(shí)段
  • 進(jìn)行監(jiān)督和非監(jiān)督的分割
  • 提取音頻縮略圖等等

可以使用以下代碼進(jìn)行安裝:

  1. pip install pyAudioAnalysis 

用于圖像處理的Python庫

如果想要在數(shù)據(jù)科學(xué)行業(yè)有一番成就,那么必須學(xué)習(xí)如何使用圖像數(shù)據(jù)。隨著系統(tǒng)能夠收集越來越多的數(shù)據(jù)(主要得益于計(jì)算資源的進(jìn)步),圖像處理越來越無處不在。

因此,請確保熟悉以下三個(gè)Python庫中的至少一個(gè)。

19. OpenCV-Python

傳送門:

https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_setup/py_intro/py_intro.html

談到圖像處理,OpenCV首先浮現(xiàn)在腦海中。OpenCV-Python是用于圖像處理的Python API,結(jié)合了OpenCV C ++ API和Python語言的最佳特性。主要用于解決計(jì)算機(jī)視覺問題。

OpenCV-Python使用了上文提到的NumPy。所有OpenCV陣列結(jié)構(gòu)都與NumPy數(shù)組相互轉(zhuǎn)換。這也使得與使用Numpy的其他庫(如SciPy和Matplotlib)集成變得更加容易。

在系統(tǒng)中安裝OpenCV-Python:

  1. pip3 install opencv-python 

以下是兩個(gè)關(guān)于如何在Python中使用OpenCV的流行教程:

  • 《基于深度學(xué)習(xí)的視頻人臉檢測模型建立(Python實(shí)現(xiàn))》傳送門:https://www.analyticsvidhya.com/blog/2018/12/introduction-face-detection-video-deep-learning-python/
  • 《16個(gè)OpenCV函數(shù)啟動(dòng)計(jì)算機(jī)視覺之旅(使用Python代碼)》傳送門:https://www.analyticsvidhya.com/blog/2019/03/opencv-functions-computer-vision-python/

20. Scikit-image

傳送門:https://scikit-image.org/

Scikit-image是另一個(gè)用于圖像處理的python庫,是用于執(zhí)行多個(gè)不同圖像處理任務(wù)的算法集合??捎糜趫D像分割、幾何變換、色彩空間操作、分析、過濾,形態(tài)學(xué)、特征檢測等等。

在安裝scikit-image前,請先安裝以下軟件包:

  • Python(> = 3.5)
  • NumPy(> = 1.11.0)
  • SciPy(> = 0.17.0)
  • joblib(> = 0.11)

這就是在機(jī)器上安裝scikit-image的方法:

  1. pip install -U scikit-learn 

21. Pillow

傳送門:https://pillow.readthedocs.io/en/stable/

Pillow是PIL(Python Imaging Library)的新版本。它是從PIL派生出來的,在一些Linux發(fā)行版(如Ubuntu)中被用作原始PIL的替代。

Pillow提供了幾種執(zhí)行圖像處理的標(biāo)準(zhǔn)程序:

  • 逐像素操作
  • 掩模和透明處理
  • 圖像過濾,例如模糊,輪廓,平滑或邊緣監(jiān)測
  • 圖像增強(qiáng),例如銳化,調(diào)整亮度、對比度或顏色
  • 在圖像上添加文字等等

安裝Pillow:

  1. pip install Pillow 

查看以下關(guān)于在計(jì)算機(jī)視覺中使用Pillow的AI漫畫:

《AI漫畫:Z.A.I.N —— 第二期:使用計(jì)算機(jī)視覺進(jìn)行面部識別》傳送門:

https://www.analyticsvidhya.com/blog/2019/06/ai-comic-zain-issue-2-facial-recognition-computer-vision/

用于數(shù)據(jù)庫的Python庫

學(xué)習(xí)如何從數(shù)據(jù)庫存儲(chǔ)、訪問和檢索數(shù)據(jù)是數(shù)據(jù)科學(xué)家必備的技能。但是如何在不首先檢索數(shù)據(jù)的情況下做到建模呢?

接下來介紹兩個(gè)與SQL相關(guān)的Python庫。

22. psycopg

傳送門:http://initd.org/psycopg/

Psycopg是Python編程語言中最流行的PostgreSQL(高級開源代碼關(guān)系數(shù)據(jù)庫)適配器。Psycopg的核心是完全實(shí)現(xiàn)Python DB API 2.0規(guī)范。

目前的psycopg2實(shí)現(xiàn)支持:

  • Python版本2.7
  • Python 3版本(3.4到3.7)
  • PostgreSQL服務(wù)器版本(7.4到11)
  • PostgreSQL客戶端庫版本(9.1以上)

以下是安裝psycopg2的方法:

  1. pip install psycopg2 

23. SQLAlchemy

傳送門:https://www.sqlalchemy.org/

SQL是最流行的數(shù)據(jù)庫語言。SQLAlchemy是pythonSQL工具包和對象關(guān)系映射器,它為應(yīng)用程序開發(fā)人員提供了SQL的全部功能,且極具靈活性。

SQL旨在實(shí)現(xiàn)高效、高性能的數(shù)據(jù)庫訪問。SQLAlchemy將數(shù)據(jù)庫視為關(guān)系代數(shù)引擎,而不僅僅是表的集合。

要安裝SQLAlchemy,可以使用以下代碼行:

  1. pip install SQLAlchemy 

用于部署的Python庫

你知道哪些模型部署?部署模型意味著將最終模型放入最終應(yīng)用程序(技術(shù)上稱為生產(chǎn)環(huán)境)。

24. Flask

傳送門:http://flask.pocoo.org/docs/1.0/

Flask是一個(gè)用Python編寫的Web框架,廣泛用于部署數(shù)據(jù)科學(xué)模型。Flask由兩個(gè)部分組成:

  • Werkzeug:Python編程語言的實(shí)用程序庫
  • Jinja:Python的模板引擎

查看下面的示例以打印“Hello world”:

  1. from flask import Flask 
  2. app = Flask(__name__) 
  3. @app.route("/") 
  4. def hello(): 
  5.     return "HelloWorld!" 
  6. if __name__ == "__main__": 
  7.     app.run() 

以下文章是學(xué)習(xí)Flask的良好開端:

《在生產(chǎn)中將機(jī)器學(xué)習(xí)模型部署為API的教程(使用Flask)》傳送門:

https://www.analyticsvidhya.com/blog/2017/09/machine-learning-models-as-apis-using-flask/

責(zé)任編輯:趙寧寧 來源: 讀芯術(shù)
相關(guān)推薦

2019-10-14 17:08:04

人工智能機(jī)器人Facebook

2012-09-17 15:04:00

2018-12-03 08:42:02

反向代理層DNS輪詢架構(gòu)

2016-08-24 18:32:16

2011-02-15 10:35:17

2020-12-16 15:37:19

Python編程語言開發(fā)

2019-07-08 16:18:56

PandasPyhton庫數(shù)據(jù)處理

2024-11-12 12:03:27

2011-04-26 13:20:09

投影機(jī)

2022-07-29 09:54:32

網(wǎng)絡(luò)安全地緣沖突

2023-07-18 08:00:00

聊天機(jī)器人人工智能

2019-10-09 08:58:31

Python編程語言開發(fā)

2023-10-12 13:06:00

PyCharm插件CSV

2020-03-05 12:12:54

數(shù)據(jù)Python開發(fā)

2023-10-23 18:01:44

插件服務(wù)器擴(kuò)展

2017-03-22 11:18:44

2017Java類庫

2018-06-25 14:52:22

編程語言Python面試題

2022-07-18 10:15:16

Python

2020-04-03 19:21:59

JavaScript編程語言開發(fā)

2012-09-26 13:49:29

Windows 8微軟
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號