自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="za68r"></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

吐血整理！絕不能錯(cuò)過的24個(gè)Python庫

作者：讀芯術(shù) 2019-08-01 13:02:58

開發(fā) 后端開發(fā)工具

由于Python庫種類很多，要跟上其發(fā)展速度非常困難。因此，本文介紹了24種涵蓋端到端數(shù)據(jù)科學(xué)生命周期的Python庫。

Python有以下三個(gè)特點(diǎn)：

易用性和靈活性
全行業(yè)高接受度：Python無疑是業(yè)界最流行的數(shù)據(jù)科學(xué)語言
用于數(shù)據(jù)科學(xué)的Python庫的數(shù)量優(yōu)勢

事實(shí)上，由于Python庫種類很多，要跟上其發(fā)展速度非常困難。因此，本文介紹了24種涵蓋端到端數(shù)據(jù)科學(xué)生命周期的Python庫。

文中提及了用于數(shù)據(jù)清理、數(shù)據(jù)操作、可視化、構(gòu)建模型甚至模型部署(以及其他用途)的庫。這是一個(gè)相當(dāng)全面的列表，有助于你使用Python開啟數(shù)據(jù)科學(xué)之旅。

用于數(shù)據(jù)收集的Python庫

你是否曾遇到過這樣的情況：缺少解決問題的數(shù)據(jù)?這是數(shù)據(jù)科學(xué)中一個(gè)永恒的問題。這也是為什么學(xué)習(xí)提取和收集數(shù)據(jù)對數(shù)據(jù)科學(xué)家來說是一項(xiàng)非常重要的技能。數(shù)據(jù)提取和收集開辟了前所未有的道路。

以下是三個(gè)用于提取和收集數(shù)據(jù)的Python庫：

1. Beautiful Soup

傳送門：https://www.crummy.com/software/BeautifulSoup/bs4/doc/

收集數(shù)據(jù)的最佳方式之一就是抓取網(wǎng)站(當(dāng)然是以合乎道德和法律的手段!)徒手做這件事需要耗費(fèi)大量的勞動(dòng)和時(shí)間。Beautiful Soup無疑是一大救星。

Beautiful Soup是一個(gè)HTML和XML解析器，可為被解析的頁面創(chuàng)建解析樹，從而用于從web頁面中提取數(shù)據(jù)。從網(wǎng)頁中提取數(shù)據(jù)的過程稱為網(wǎng)頁抓取。

使用以下代碼可安裝BeautifulSoup：

pip install beautifulsoup4

下面是一個(gè)可實(shí)現(xiàn)從HTML中提取所有錨標(biāo)記的Beautiful Soup簡單代碼：

#!/usr/bin/python3 
# Anchor extraction from html document 
from bs4 import BeautifulSoup 
from urllib.request import urlopen 
 
with urlopen('LINK') as response: 
    soup = BeautifulSoup(response, 'html.parser') 
    for anchor in soup.find_all('a'): 
        print(anchor.get('href', '/'))

建議閱讀下面的文章，學(xué)習(xí)如何在Python中使用Beautiful Soup：

《新手指南：在Python中使用BeautifulSoup進(jìn)行網(wǎng)頁抓取》傳送門：

https://www.analyticsvidhya.com/blog/2015/10/beginner-guide-web-scraping-beautiful-soup-python/

2. Scrapy

傳送門：https://docs.scrapy.org/en/latest/intro/tutorial.html

Scrapy是另一個(gè)可有效用于網(wǎng)頁抓取的Python庫。它是一個(gè)開源的協(xié)作框架，用于從網(wǎng)站中提取所需數(shù)據(jù)。使用起來快捷簡單。

下面是用于安裝Scrapy的代碼：

pip install scrapy

Scrapy是一個(gè)用于大規(guī)模網(wǎng)頁抓取的框架?？商峁┧行枰墓ぞ哂行У貜木W(wǎng)站中抓取數(shù)據(jù)，且依需要處理數(shù)據(jù)，并以使用者偏好的結(jié)構(gòu)和格式存儲(chǔ)數(shù)據(jù)。

下面是一個(gè)實(shí)現(xiàn)Scrapy的簡單代碼：

import scrapy 
 
class Spider(scrapy.Spider): 
    name = 'NAME' 
    start_urls = ['LINK'] 
 
    def parse(self, response): 
        for title in response.css('.post-header>h2'): 
            yield {'title': title.css('a ::text').get()} 
 
        for next_page in response.css('a.next-posts-link'): 
            yield response.follow(next_page, self.parse

下面是一個(gè)學(xué)習(xí)Scrapy并在Python中實(shí)現(xiàn)Scrapy的絕佳教程：

《使用Scrapy在Python中進(jìn)行網(wǎng)頁抓取(含多個(gè)示例)》傳送門：

https://www.analyticsvidhya.com/blog/2017/07/web-scraping-in-python-using-scrapy/

3. Selenium

傳送門：https://www.seleniumhq.org/

Selenium是一個(gè)倍受歡迎的自動(dòng)化瀏覽器工具。在業(yè)界常用于測試，但對于網(wǎng)頁抓取也非常方便。Selenium在IT領(lǐng)域非常流行。

編寫Python腳本來自動(dòng)化使用Selenium的web瀏覽器是很容易的。它允許免費(fèi)高效地提取數(shù)據(jù)，并將其存儲(chǔ)在首選格式中以備后用。

關(guān)于使用Python和Selenium抓取YouTube視頻數(shù)據(jù)的文章：

《數(shù)據(jù)科學(xué)項(xiàng)目：使用Python和Selenium抓取YouTube數(shù)據(jù)對視頻進(jìn)行分類》傳送門：

https://www.analyticsvidhya.com/blog/2019/05/scraping-classifying-youtube-video-data-python-selenium/

用于數(shù)據(jù)清理和數(shù)據(jù)操作的Python庫

收集了數(shù)據(jù)之后，接下來要清理可能面臨的任何混亂數(shù)據(jù)，并學(xué)習(xí)如何操作數(shù)據(jù)，方便數(shù)據(jù)為建模做好準(zhǔn)備。

下面是四個(gè)可用于數(shù)據(jù)清理和數(shù)據(jù)操作的Python庫。請記住，文中僅指明在現(xiàn)實(shí)世界中處理結(jié)構(gòu)化(數(shù)值)數(shù)據(jù)和文本數(shù)據(jù)(非結(jié)構(gòu)化)——而該庫列表涵蓋了所有內(nèi)容。

4. Pandas

傳送門：https://pandas.pydata.org/pandas-docs/stable/

在數(shù)據(jù)操作和數(shù)據(jù)分析方面，Pandas絕無敵手。Pandas一度是最流行的Python庫。Pandas是用Python語言編寫的，主要用于數(shù)據(jù)操作和數(shù)據(jù)分析。

這個(gè)名稱來源于術(shù)語“面板數(shù)據(jù)”，“面板數(shù)據(jù)”是一個(gè)計(jì)量經(jīng)濟(jì)學(xué)術(shù)語，指的是包含同一個(gè)人在多個(gè)時(shí)間段內(nèi)的觀察結(jié)果的數(shù)據(jù)集。

Pandas在Python or Anaconda中已完成預(yù)安裝，但以防需要，安裝代碼如下：

pip install pandas

Pandas有以下特點(diǎn)：

數(shù)據(jù)集連接和合并
刪除和插入數(shù)據(jù)結(jié)構(gòu)列
數(shù)據(jù)過濾
重塑數(shù)據(jù)集
使用DataFrame對象來操作數(shù)據(jù)等

下面是一篇文章以及一份很棒的Cheatsheet，有助于使Pandas技能達(dá)標(biāo)：

《Python中用于數(shù)據(jù)操作的12種有用的Pandas技術(shù)》傳送門：https://www.analyticsvidhya.com/blog/2016/01/12-pandas-techniques-python-data-manipulation/
《CheatSheet:在Python中使用Pandas進(jìn)行數(shù)據(jù)探索》傳送門：https://www.analyticsvidhya.com/blog/2015/07/11-steps-perform-data-analysis-pandas-python/

5. PyOD

傳送門：https://pyod.readthedocs.io/en/latest/

難以發(fā)現(xiàn)異常值?這絕非個(gè)例。別擔(dān)心，PyOD庫就在這里。

PyOD是一個(gè)全面的、可伸縮的Python工具包，用于檢測外圍對象。離群值檢測基本上是識別與大多數(shù)數(shù)據(jù)顯著不同的稀有項(xiàng)或觀測值。

以下代碼可用于下載pyOD：

pip install pyod

PyOD是如何工作的?如何實(shí)現(xiàn)PyOD?下面一則指南將回答所有關(guān)于PyOD的問題:

《學(xué)習(xí)在Python中使用PyOD庫檢測異常值的絕佳教程》傳送門：

https://www.analyticsvidhya.com/blog/2019/02/outlier-detection-python-pyod/

6. NumPy

傳送門：https://www.numpy.org/

與Pandas一樣，NumPy也是一個(gè)非常受歡迎的Python庫。NumPy引入了支持大型多維數(shù)組和矩陣的函數(shù)，同時(shí)還引入了高級數(shù)學(xué)函數(shù)來處理這些數(shù)組和矩陣。

NumPy是一個(gè)開源庫，有多方貢獻(xiàn)者。在 Anaconda和Python中已預(yù)安裝Numpy，但以防需要，下面是安裝代碼：

$ pip install numpy

下面是使用NumPy可執(zhí)行的一些基本功能：

創(chuàng)建數(shù)組：

import numpy as np 
x = np.array([1, 2, 3]) 
print(x) 
y = np.arange(10) 
print(y)

output - [1 2 3] 
         [0 1 2 3 4 5 6 7 8 9]

基本運(yùn)算：

a = np.array([1, 2, 3, 6]) 
b = np.linspace(0, 2, 4) 
c = a - b 
print(c) 
print(a**2)

output - [1. 1.33333333 1.66666667 4. ] 
         [ 1 4 9 36]

以及更多其他功能!

7. SpaCy

傳送門：https://spacy.io/

目前已經(jīng)討論了如何清理數(shù)據(jù)和處理數(shù)值數(shù)據(jù)。但是如果正在處理文本數(shù)據(jù)呢?到目前為止，現(xiàn)有的庫都無法解決該問題。

Spacy是一個(gè)非常有用且靈活的自然語言處理( NLP )庫和框架，用于清理創(chuàng)建模型的文本文檔。與類似用途的其他庫相比，SpaCy速度更快。

在Linux中安裝Spacy：

pip install -U spacy 
python -m spacy download en

其他操作系統(tǒng)上安裝Spacy，請點(diǎn)擊：https://spacy.io/usage

以下是學(xué)習(xí)spaCy的課程：

《簡化自然語言處理——使用SpaCy(在Python中)》傳送門：

https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-spacy-%e2%80%8bin-python/

用于數(shù)據(jù)可視化的Python庫

下一步是什么呢?數(shù)據(jù)可視化!此處假設(shè)已得到驗(yàn)證，并且發(fā)掘了隱藏的觀點(diǎn)和模式。

下面是三個(gè)用于數(shù)據(jù)可視化的絕佳Python庫。

8. Matplotlib

傳送門：https://matplotlib.org/

Matplotlib是Python中最流行的數(shù)據(jù)可視化庫。允許生成和構(gòu)建各種各樣的圖。Matplotlib是筆者的首選庫，可與Seaborn一起用于進(jìn)行數(shù)據(jù)可視化研究。

以下是安裝Matplotli的代碼：

$ pip install matplotlib

下面是使用Matplotlib構(gòu)建的不同類型圖示的部分例子：

柱狀圖：

%matplotlib inline 
import matplotlib.pyplot as plt 
from numpy.random import normal 
x = normal(size=100) 
plt.hist(x, bins=20) 
plt.show()

3D 圖表：

from matplotlib import cm 
from mpl_toolkits.mplot3d import Axes3D 
import matplotlib.pyplot as plt 
import numpy as np 
fig = plt.figure() 
ax = fig.gca(projection='3d') 
X = np.arange(-10, 10, 0.1) 
Y = np.arange(-10, 10, 0.1) 
X, Y = np.meshgrid(X, Y) 
R = np.sqrt(X**2 + Y**2) 
Z = np.sin(R) 
surf = ax.plot_surface(X, Y, Z, rstride=1,cstride=1, cmcmap=cm.coolwarm) 
plt.show()

目前已經(jīng)介紹了Pandas、NumPy和Matplotlib，那么請查看下面的教程，該教程結(jié)合了以上三個(gè)庫進(jìn)行講解：

《使用NumPy、Matplotlib和Pandas在Python中進(jìn)行數(shù)據(jù)探索的終極指南》傳送門：

https://www.analyticsvidhya.com/blog/2015/04/comprehensive-guide-data-exploration-sas-using-python-numpy-scipy-matplotlib-pandas/

9. Seaborn

傳送門：https://seaborn.pydata.org/

Seaborn是另一個(gè)基于matplotlib的繪圖庫。它是一個(gè)為繪制有吸引力的圖像而提供高級接口的python庫。matplotlib能實(shí)現(xiàn)功能，Seaborn只是以另一種更吸引人的視覺方式來實(shí)現(xiàn)。

Seaborn 的一些特點(diǎn)：

作為一個(gè)面向數(shù)據(jù)集的API，可用于查驗(yàn)多個(gè)變量之間的關(guān)系
便于查看復(fù)雜數(shù)據(jù)集的整體結(jié)構(gòu)
用于選擇顯示數(shù)據(jù)中模式的調(diào)色板的工具

下面一行代碼可用于安裝Seaborn：

pip install seaborn

瀏覽下面這些很酷的圖表，看看seaborn能做些什么：

import seaborn as sns 
sns.set() 
tips =sns.load_dataset("tips") 
sns.relplot(x="total_bill",y="tip", col="time", 
            hue="smoker",style="smoker", size="size", 
            data=tips);

下面是另外一個(gè)例子：

import seaborn as sns 
sns.catplot(x="day",y="total_bill", hue="smoker", 
            kind="violin",split=True, data=tips);

10. Bokeh

傳送門：https://bokeh.pydata.org/en/latest/

Bokeh是一個(gè)面向現(xiàn)代網(wǎng)頁瀏覽器的交互式可視化庫，為大量數(shù)據(jù)集提供優(yōu)美的通用圖形結(jié)構(gòu)。

Bokeh可用于創(chuàng)建交互式繪圖、儀表板和數(shù)據(jù)應(yīng)用程序。

安裝：

pip install bokeh

了解更多關(guān)于Bokeh的知識及其實(shí)際應(yīng)用：

《使用Bokeh的交互式數(shù)據(jù)可視化(在Python中)》傳送門：

https://www.analyticsvidhya.com/blog/2015/08/interactive-data-visualization-library-python-bokeh/

用于建模的Python庫

現(xiàn)在到了本文最令人期待的部分——建模!這也是大多數(shù)人一開始接觸數(shù)據(jù)科學(xué)的原因。

接下來通過這三個(gè)Python庫來探索建模。

11. Scikit-learn

傳送門：https://scikit-learn.org/stable/

就像用于數(shù)據(jù)操作的Pandas和用于可視化的matplotlib一樣，scikit-learn是Python構(gòu)建模型中的佼佼者。沒有什么能與之媲美。

事實(shí)上，scikit-learn建立在NumPy，SciPy和matplotlib之上。它是開放源碼的，每個(gè)人都可以訪問，并且可以在各種環(huán)境中重用。

Scikit-learn支持在機(jī)器學(xué)習(xí)中執(zhí)行的不同操作，如分類、回歸、聚類和模型選擇等。命名它——那么scikit-learn會(huì)有一個(gè)模塊。

建議瀏覽以下鏈接以了解有關(guān)scikit-learn的更多信息：

《Python中的Scikit-learn——筆者去年學(xué)到的最重要的機(jī)器學(xué)習(xí)工具!》傳送門：

https://www.analyticsvidhya.com/blog/2015/01/scikit-learn-python-machine-learning-tool/

12. TensorFlow

傳送門：https://www.tensorflow.org/

TensorFlow由谷歌開發(fā)，是一個(gè)流行的深度學(xué)習(xí)庫，可幫助構(gòu)建、培訓(xùn)不同模型。是一個(gè)開放源碼的端到端平臺。TensorFlow提供簡單的模型構(gòu)建，強(qiáng)大的機(jī)器學(xué)習(xí)生產(chǎn)，以及強(qiáng)大的實(shí)驗(yàn)工具和庫。

TensorFlow提供多個(gè)抽象級別，可根據(jù)需要進(jìn)行選擇。TensorFlow通過使用高級Keras API來構(gòu)建和訓(xùn)練模型，這使TensorFlow入門和機(jī)器學(xué)習(xí)變得容易。

安裝傳送門：https://www.tensorflow.org/install

使用TensorFlow從閱讀這些文章開始：

《TensorFlow 101:理解張量和圖像以便開始深入學(xué)習(xí)》傳送門：https://www.analyticsvidhya.com/blog/2017/03/tensorflow-understanding-tensors-and-graphs/
《開始使用Keras和TensorFlow在R中進(jìn)行深度學(xué)習(xí)》傳送門：https://www.analyticsvidhya.com/blog/2017/06/getting-started-with-deep-learning-using-keras-in-r/

13. PyTorch

傳送門：https://pytorch.org/

什么是PyTorch?其實(shí)，這是一個(gè)基于Python的科學(xué)計(jì)算包，其功能如下：

NumPy的替代品，可使用GPU的強(qiáng)大功能
深度學(xué)習(xí)研究型平臺，擁有最大靈活性和最快速度

安裝指南傳送門：https://pytorch.org/get-started/locally/

PyTorch提供以下功能：

混合前端
工具和庫：由研發(fā)人員組成的活躍社區(qū)已經(jīng)建立了一個(gè)豐富的工具和庫的生態(tài)系統(tǒng)，用于擴(kuò)展PyTorch并支持計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)等領(lǐng)域的開發(fā)
云支持：PyTorch支持在主要的云平臺上運(yùn)行，通過預(yù)構(gòu)建的映像、對GPU的大規(guī)模訓(xùn)練、以及在生產(chǎn)規(guī)模環(huán)境中運(yùn)行模型的能力等，可提供無摩擦的開發(fā)和輕松拓展

以下是兩篇有關(guān)PyTorch的十分詳細(xì)且易于理解的文章：

《PyTorch簡介——一個(gè)簡單但功能強(qiáng)大的深度學(xué)習(xí)庫》傳送門：https://www.analyticsvidhya.com/blog/2018/02/pytorch-tutorial/
《開始使用PyTorch——學(xué)習(xí)如何建立快速和準(zhǔn)確的神經(jīng)網(wǎng)絡(luò)(以4個(gè)案例研究為例)》傳送門：https://www.analyticsvidhya.com/blog/2019/01/guide-pytorch-neural-networks-case-studies/

用于數(shù)據(jù)解釋性的Python庫

你真的了解模型如何工作嗎?能解釋模型為什么能夠得出結(jié)果嗎?這些是每個(gè)數(shù)據(jù)科學(xué)家都能夠回答的問題。構(gòu)建黑盒模型在業(yè)界毫無用處。

所以，上文中已經(jīng)提到的兩個(gè)Python庫可以幫助解釋模型的性能。

14. LIME

傳送門：https://github.com/marcotcr/lime

LIME是一種算法(庫)，可以解釋任何分類器或回歸量的預(yù)測。LIME是如何做到的呢?通過可解釋的模型在局部不斷接近預(yù)測值，這個(gè)模型解釋器可用于生成任何分類算法的解釋。

安裝LIME很簡單：

pip install lime

下文將從總體上幫助開發(fā)LIME背后的直覺和模型可解釋性：

《在機(jī)器學(xué)習(xí)模型中建立信任(在Python中使用LIME)》傳送門：

https://www.analyticsvidhya.com/blog/2017/06/building-trust-in-machine-learning-models/

15. H2O

傳送門：https://github.com/h2oai/mli-resources

相信很多人都聽說過H2O.ai，自動(dòng)化機(jī)器學(xué)習(xí)的市場領(lǐng)導(dǎo)者。但是你知道其在Python中也有一個(gè)模型可解釋性庫嗎?

H2O的無人駕駛AI，提供簡單的數(shù)據(jù)可視化技術(shù)，用于表示高度特征交互和非線性模型行為，通過可視化提供機(jī)器學(xué)習(xí)可解釋性(MLI)，說明建模結(jié)果和模型中特征的影響。

通過下文，閱讀有關(guān)H2O的無人駕駛AI執(zhí)行MLI的更多信息。

《機(jī)器學(xué)習(xí)可解釋性》傳送門：

https://www.h2o.ai/wp-content/uploads/2018/01/Machine-Learning-Interpretability-MLI_datasheet_v4-1.pdf

用于音頻處理的Python庫

音頻處理或音頻分析是指從音頻信號中提取信息和含義以進(jìn)行分析、分類或任何其他任務(wù)。這正在成為深度學(xué)習(xí)中的一種流行功能，所以要留意這一點(diǎn)。

16. LibROSA

傳送門：https://librosa.github.io/librosa/

LibROSA是一個(gè)用于音樂和音頻分析的Python庫。它提供了創(chuàng)建音樂信息檢索系統(tǒng)所需的構(gòu)建塊。

安裝指南傳送門：https://librosa.github.io/librosa/install.html

這是一篇關(guān)于音頻處理及其工作原理的深度文章：

《利用深度學(xué)習(xí)開始音頻數(shù)據(jù)分析(含案例研究)》傳送門：

https://www.analyticsvidhya.com/blog/2017/08/audio-voice-processing-deep-learning/

17. Madmom

傳送門：https://github.com/CPJKU/madmom

Madmom是一個(gè)用于音頻數(shù)據(jù)分析的很棒的Python庫。它是一個(gè)用Python編寫的音頻信號處理庫，主要用于音樂信息檢索(MIR)任務(wù)。

以下是安裝Madmom的必備條件：

NumPy
SciPy
Cython
Mido

以下軟件包用于測試安裝：

PyTest
Fyaudio
PyFftw

安裝Madmom的代碼：

pip install madmom

下文可用以了解Madmom如何用于音樂信息檢索：

《學(xué)習(xí)音樂信息檢索的音頻節(jié)拍追蹤(使用Python代碼)》傳送門：

https://www.analyticsvidhya.com/blog/2018/02/audio-beat-tracking-for-music-information-retrieval/

18. pyAudioAnalysis

傳送門：https://github.com/tyiannak/pyAudioAnalysis

pyAudioAnalysis是一個(gè)用于音頻特征提取、分類和分段的Python庫，涵蓋廣泛的音頻分析任務(wù)，例如：

對未知聲音進(jìn)行分類
檢測音頻故障并排除長時(shí)間錄音中的靜音時(shí)段
進(jìn)行監(jiān)督和非監(jiān)督的分割
提取音頻縮略圖等等

可以使用以下代碼進(jìn)行安裝：

pip install pyAudioAnalysis

用于圖像處理的Python庫

如果想要在數(shù)據(jù)科學(xué)行業(yè)有一番成就，那么必須學(xué)習(xí)如何使用圖像數(shù)據(jù)。隨著系統(tǒng)能夠收集越來越多的數(shù)據(jù)(主要得益于計(jì)算資源的進(jìn)步)，圖像處理越來越無處不在。

因此，請確保熟悉以下三個(gè)Python庫中的至少一個(gè)。

19. OpenCV-Python

傳送門：

https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_setup/py_intro/py_intro.html

談到圖像處理，OpenCV首先浮現(xiàn)在腦海中。OpenCV-Python是用于圖像處理的Python API，結(jié)合了OpenCV C ++ API和Python語言的最佳特性。主要用于解決計(jì)算機(jī)視覺問題。

OpenCV-Python使用了上文提到的NumPy。所有OpenCV陣列結(jié)構(gòu)都與NumPy數(shù)組相互轉(zhuǎn)換。這也使得與使用Numpy的其他庫(如SciPy和Matplotlib)集成變得更加容易。

在系統(tǒng)中安裝OpenCV-Python：

pip3 install opencv-python

以下是兩個(gè)關(guān)于如何在Python中使用OpenCV的流行教程：

《基于深度學(xué)習(xí)的視頻人臉檢測模型建立(Python實(shí)現(xiàn))》傳送門：https://www.analyticsvidhya.com/blog/2018/12/introduction-face-detection-video-deep-learning-python/
《16個(gè)OpenCV函數(shù)啟動(dòng)計(jì)算機(jī)視覺之旅(使用Python代碼)》傳送門：https://www.analyticsvidhya.com/blog/2019/03/opencv-functions-computer-vision-python/

20. Scikit-image

傳送門：https://scikit-image.org/

Scikit-image是另一個(gè)用于圖像處理的python庫，是用于執(zhí)行多個(gè)不同圖像處理任務(wù)的算法集合?？捎糜趫D像分割、幾何變換、色彩空間操作、分析、過濾，形態(tài)學(xué)、特征檢測等等。

在安裝scikit-image前，請先安裝以下軟件包：

Python(> = 3.5)
NumPy(> = 1.11.0)
SciPy(> = 0.17.0)
joblib(> = 0.11)

這就是在機(jī)器上安裝scikit-image的方法：

pip install -U scikit-learn

21. Pillow

傳送門：https://pillow.readthedocs.io/en/stable/

Pillow是PIL(Python Imaging Library)的新版本。它是從PIL派生出來的，在一些Linux發(fā)行版(如Ubuntu)中被用作原始PIL的替代。

Pillow提供了幾種執(zhí)行圖像處理的標(biāo)準(zhǔn)程序：

逐像素操作
掩模和透明處理
圖像過濾，例如模糊，輪廓，平滑或邊緣監(jiān)測
圖像增強(qiáng)，例如銳化，調(diào)整亮度、對比度或顏色
在圖像上添加文字等等

安裝Pillow：

pip install Pillow

查看以下關(guān)于在計(jì)算機(jī)視覺中使用Pillow的AI漫畫：

《AI漫畫：Z.A.I.N —— 第二期：使用計(jì)算機(jī)視覺進(jìn)行面部識別》傳送門：

https://www.analyticsvidhya.com/blog/2019/06/ai-comic-zain-issue-2-facial-recognition-computer-vision/

用于數(shù)據(jù)庫的Python庫

學(xué)習(xí)如何從數(shù)據(jù)庫存儲(chǔ)、訪問和檢索數(shù)據(jù)是數(shù)據(jù)科學(xué)家必備的技能。但是如何在不首先檢索數(shù)據(jù)的情況下做到建模呢?

接下來介紹兩個(gè)與SQL相關(guān)的Python庫。

22. psycopg

傳送門：http://initd.org/psycopg/

Psycopg是Python編程語言中最流行的PostgreSQL(高級開源代碼關(guān)系數(shù)據(jù)庫)適配器。Psycopg的核心是完全實(shí)現(xiàn)Python DB API 2.0規(guī)范。

目前的psycopg2實(shí)現(xiàn)支持：

Python版本2.7
Python 3版本(3.4到3.7)
PostgreSQL服務(wù)器版本(7.4到11)
PostgreSQL客戶端庫版本(9.1以上)

以下是安裝psycopg2的方法：

pip install psycopg2

23. SQLAlchemy

傳送門：https://www.sqlalchemy.org/

SQL是最流行的數(shù)據(jù)庫語言。SQLAlchemy是pythonSQL工具包和對象關(guān)系映射器，它為應(yīng)用程序開發(fā)人員提供了SQL的全部功能，且極具靈活性。

SQL旨在實(shí)現(xiàn)高效、高性能的數(shù)據(jù)庫訪問。SQLAlchemy將數(shù)據(jù)庫視為關(guān)系代數(shù)引擎，而不僅僅是表的集合。

要安裝SQLAlchemy，可以使用以下代碼行：

pip install SQLAlchemy

用于部署的Python庫

你知道哪些模型部署?部署模型意味著將最終模型放入最終應(yīng)用程序(技術(shù)上稱為生產(chǎn)環(huán)境)。

24. Flask

傳送門：http://flask.pocoo.org/docs/1.0/

Flask是一個(gè)用Python編寫的Web框架，廣泛用于部署數(shù)據(jù)科學(xué)模型。Flask由兩個(gè)部分組成：

Werkzeug：Python編程語言的實(shí)用程序庫
Jinja：Python的模板引擎

查看下面的示例以打印“Hello world”：

from flask import Flask 
app = Flask(__name__) 
@app.route("/") 
def hello(): 
    return "HelloWorld!" 
if __name__ == "__main__": 
    app.run()

以下文章是學(xué)習(xí)Flask的良好開端：

《在生產(chǎn)中將機(jī)器學(xué)習(xí)模型部署為API的教程(使用Flask)》傳送門：

https://www.analyticsvidhya.com/blog/2017/09/machine-learning-models-as-apis-using-flask/

責(zé)任編輯：趙寧寧來源：讀芯術(shù)

Python 數(shù)據(jù)科學(xué)數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營