數(shù)據(jù)科學(xué)家必須知道的前十大Python庫(kù)
Python是比較流行和廣為人知的編程語(yǔ)言之一,它已取代了業(yè)界的許多編程語(yǔ)言。它是數(shù)據(jù)科學(xué)專(zhuān)業(yè)人士比較喜歡使用的編程語(yǔ)言之一,因?yàn)樗鼡碛旋嫶蟮膸?kù)。
Python因其簡(jiǎn)單易用而被稱(chēng)為初學(xué)者級(jí)編程語(yǔ)言,它的編程語(yǔ)法易于學(xué)習(xí),并且與C,Java和C ++相比具有較高的水平。
為了獲得更準(zhǔn)確的算法和編碼,Analytics Insight給出前10個(gè)Python庫(kù)
PyTorch
Pytorch是一個(gè)開(kāi)源庫(kù),它基本上替代了Numpy。 PyTorch帶有高級(jí)功能,可用于構(gòu)建深度神經(jīng)網(wǎng)絡(luò)。數(shù)據(jù)科學(xué)專(zhuān)業(yè)人士仍然可以使用其他語(yǔ)言,例如scipy,Cython和numpy,這些語(yǔ)言可在需要時(shí)幫助擴(kuò)展PyTorch。 Pytorch被包括Facebook,Twitter,Nvidia,Uber在內(nèi)的許多組織所使用,用于快速建立研究原型并訓(xùn)練深度學(xué)習(xí)模型。
GitHub:https://github.com/pytorch/pytorch
Arrow
Arrow是一個(gè)人類(lèi)友好的Python庫(kù),它提供了諸如對(duì)日期,時(shí)間和時(shí)間戳進(jìn)行轉(zhuǎn)換,操縱,創(chuàng)建和格式化的功能。它支持Python 2和3,它是DateTime的替代方法,它具有更好的界面,以促進(jìn)豐富的功能。
GitHub:https://github.com/crsmithdev/arrow
IPython
這是最有用的python工具之一,為用戶提供了豐富的體系結(jié)構(gòu)。使用IPython,用戶可以在其瀏覽器中編寫(xiě)和執(zhí)行python代碼。 Ipython可在多種操作系統(tǒng)上運(yùn)行,包括Windows,Mac OS X,Linux和大多數(shù)其他Unix OS。 Ipython為用戶提供了更多功能,包括幫助功能,高級(jí)編輯等。
GitHub:https://github.com/ipython/ipython
TensorFlow
Tensor flow是由Google Brain團(tuán)隊(duì)創(chuàng)建的開(kāi)源機(jī)器學(xué)習(xí)python庫(kù)。 Tensor流庫(kù)用于開(kāi)發(fā),訓(xùn)練和設(shè)計(jì)深度學(xué)習(xí)模型,并且可以用于進(jìn)行數(shù)值計(jì)算。 Tensor Flow是Theano的替代產(chǎn)品,它可以在移動(dòng)設(shè)備,單CPU系統(tǒng)和GPU上運(yùn)行。
GitHub:https://github.com/tensorflow/tensorflow
Caffe2
Caffe2是將Caffe框架帶入現(xiàn)代世界的嘗試。它支持分布式培訓(xùn),甚至可以在移動(dòng)平臺(tái)中進(jìn)行部署。雖然PyTorch可能更適合研究,但Caffe2適合進(jìn)行大規(guī)模部署,如Facebook上所示。
GitHub:https://github.com/caffe2/caffe2
Scrapy
Scrappy是一個(gè)廣泛使用的Python Web抓取庫(kù)。 Scrappy最初用于創(chuàng)建爬網(wǎng)程序,ands 則專(zhuān)門(mén)用于抓取,如其名稱(chēng)所示?,F(xiàn)在它用于多種用途,包括數(shù)據(jù)挖掘,自動(dòng)化測(cè)試等。scrapy是開(kāi)源的,必須具有庫(kù)。
GitHub:https://github.com/scrapy/scrapy
Requests
Requests是著名的Python庫(kù)之一,該庫(kù)在Apache2下獲得許可并用Python編寫(xiě)。該庫(kù)可幫助用戶與多種語(yǔ)言進(jìn)行交互。借助Requests庫(kù),用戶可以手動(dòng)將字符串串接到其URL。他們可以使用Request 庫(kù)將HTTP請(qǐng)求發(fā)送到服務(wù)器,并且可以添加表單數(shù)據(jù),內(nèi)容(如標(biāo)頭,多部分文件等)。
GitHub:https://github.com/requests/requests
Zappa
Zappa是由Miserlou創(chuàng)建的比較好的python軟件包之一,它很容易在API Gateway和Amazon Web Services Lambda上構(gòu)建和實(shí)現(xiàn)無(wú)服務(wù)器應(yīng)用程序。由于AWS自動(dòng)處理水平擴(kuò)展,因此沒(méi)有請(qǐng)求會(huì)超時(shí)。使用Zappa,您可以使用Zappa在一行中更新代碼。
GitHub:https://github.com/Miserlou/Zappa
Flashtext
FlashText是更好的選擇,它的優(yōu)點(diǎn)包括,無(wú)論用戶有多少個(gè)搜索詞,其運(yùn)行時(shí)間都是相同的,而regexp則相反,運(yùn)行時(shí)間幾乎隨詞的數(shù)量線性增加。
GitHub:https://github.com/vi3k6i5/flashtext
Fire
Fire是一個(gè)開(kāi)源庫(kù),可以為任何Python項(xiàng)目自動(dòng)生成命令行(CLI)。用戶幾乎不需要編寫(xiě)任何代碼或文檔字符串來(lái)構(gòu)建其CLI!他們只需要調(diào)用Fire方法并將其傳遞給CLI的任何方法傳遞給它:函數(shù),對(duì)象,類(lèi),字典,甚至根本不傳遞任何參數(shù),這會(huì)將整個(gè)代碼轉(zhuǎn)換為CLI 。
GitHub:https://github.com/google/python-fire