關(guān)于深度學(xué)習(xí)、NLP和計算機視覺的30個超級Python庫
本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。
請注意,下面的圖示由Gregory Piatetsky繪制,每個庫都有其類別,按星標和貢獻者對其進行繪制,符號大小則以該庫在Github上的提交次數(shù)的對數(shù)表示。
圖1:深度學(xué)習(xí),自然語言處理和計算機視覺的頂級Python庫
按星級和貢獻者數(shù)量繪制;按提交數(shù)的對數(shù)表示相對大小
那么事不宜遲 ,下面就是由KDnuggets員工精心挑選的30個可用于深度學(xué)習(xí),自然語言處理和計算機視覺頂級Python庫。
深度學(xué)習(xí)
1. TensorFlow
星標:149000,提交數(shù):97741,貢獻者:754
TensorFlow是針對機器學(xué)習(xí)的端對端開源平臺。它具備綜合靈活的工具、庫和社區(qū)資源,可以幫助研究者推動先進的機器學(xué)習(xí)技術(shù)的發(fā)展以及開發(fā)者更輕松地開發(fā)和發(fā)布由機器學(xué)習(xí)支持的應(yīng)用。
2. Keras
星標:50000,提交數(shù):5349,貢獻者:864
Keras是由python編寫的機器學(xué)習(xí)API,其運行在機器學(xué)習(xí)的頂級平臺TensorFlow上。
3. PyTorch
星標:43200,提交數(shù):30696,貢獻者:1619
使用Python實現(xiàn)的張量和動態(tài)神經(jīng)網(wǎng)絡(luò),并帶有強大的GPU加速。
4. fastai
星標:19800,提交數(shù):1450,貢獻者:607
通過利用當下最佳的技術(shù)實踐,fastai極快地簡化了訓(xùn)練過程也加速了神經(jīng)網(wǎng)絡(luò)。
5. PyTorch Lightning
星標:9600,提交數(shù):3594,貢獻者:317
<ahelp_1" name="help_1"><divfinished-text"><divch-text"></divch-text"></divfinished-text"></ahelp_1">
針對高性能AI研究的封裝輕量版PyTorch??煽s小你的模型,而不是提供小的樣板。
6. JAX
星標:10000,提交數(shù):5708,貢獻者:221
Python+NumPy程序的組合變換:區(qū)分、向量化、在GPU/TPU上的JIT等等。
7. MXNet
星標:19100,提交數(shù):11387,貢獻者:839
帶有動態(tài)和突變感知的數(shù)據(jù)流管理調(diào)度程序的輕量、便捷、靈活的分布式/移動機器學(xué)習(xí)庫:支持Python、R、Julia、Scala、Go、JavaScript等等。
8. Ignite
星標:3100,提交數(shù):747,貢獻者:112
可靈活透明地訓(xùn)練評估PyTorch神經(jīng)網(wǎng)絡(luò)的高級別庫。
自然語言處理
9. FastText
星標:21700,提交數(shù):379,貢獻者:47
fastText是一個可高效學(xué)習(xí)單詞表意和句子分類的庫。
10. spaCy
星標:17400,提交數(shù):11628,貢獻者:482
使用Python和Cython實現(xiàn)的工業(yè)級自然語言處理庫(NLP)
11. gensim
星標:11200,提交數(shù):4024,貢獻者:361
gensim通過使用大型語料庫進行主題建模、文檔索引和相似性檢索。目標受眾是自然語言處理(NLP)和信息檢索(IR)社區(qū)
12. NLTK
星標:9300,提交數(shù):13990,貢獻者:319
NLTK——自然語言工具箱——是一整套針對自然語言處理研究和開發(fā)的開源Python模塊、數(shù)據(jù)集和教程
13. Datasets(Huggingface)
星標:4300,提交數(shù):568,貢獻者:64
用于自然語言處理的使用PyTorch,TensorFlow,NumPy和Pandas工具的快速,高效,開放式數(shù)據(jù)集和評估指標
14. Tokenizers(Huggingface)
星標:3800,提交數(shù):1252,貢獻者:30
針對研究和生產(chǎn)的快速頂級的分詞器
15. Transformers(Huggingface)
星標:3500,提交數(shù):5480,貢獻者:585
Transformers:針對Pytorch和TensorFlow 2.0 的頂級自然語言處理庫
16. Stanza
星標:4800,提交數(shù):1514,貢獻者:19
針對很多人類語言的正式標準NLP Python庫
17. TextBlob
星標:7300,提交數(shù):542,貢獻者:24
簡單,Python風(fēng)格,文本處理-情感分析,詞性標記,名詞短語提取,翻譯等等。
18. PyTorch-NLP
星標:1800,提交數(shù):442,貢獻者:15
用于PyTorch自然語言處理(NLP)的基礎(chǔ)實用工具
19. Textacy
星標:1500,提交數(shù):1324,貢獻者:23
用于執(zhí)行各種自然語言處理(NLP)任務(wù)的Python庫,構(gòu)建在一個高性能spaCy庫之上。
20. Finetune
星標:626,提交數(shù):1405,貢獻者:13
Finetune是一個庫,它允許用戶利用最新的預(yù)訓(xùn)練NLP模型來執(zhí)行各種下游任務(wù)。
21. TextHero
星標:1900,提交數(shù):266,貢獻者:17
文本預(yù)處理、表示和可視化,從零到精通。
22. Spark NLP
星標:1700,提交數(shù):4363,貢獻者:50
Spark NLP是建立在Apache Spark ML之上的自然語言處理庫。
23. GluonNLP
星標:2200,提交數(shù):712,貢獻者:72
GluonNLP這個工具包,可簡化文本預(yù)處理,數(shù)據(jù)集加載和神經(jīng)模型構(gòu)建,以幫助您加快對自然語言處理(NLP)的研究。
計算機視覺
24. Pillow
星標:7800,提交數(shù):10799,貢獻者:303
Pillow是個對用戶十分友好的PIL分支。PIL是Python圖像庫
25. OpenCV
星標:49600,提交數(shù):29453,貢獻者:1234
開源計算機視覺庫
26. scikit-image
星標:4000,提交數(shù):12352,貢獻者:403
用Python做圖像處理
27. Mahotas
星標:644,提交數(shù):1273,貢獻者:25
Mahotas是個包含了最快的計算機視覺算法(所有算法用C++實現(xiàn)保證運行速度)的庫,針對numpy數(shù)組運行
28. Simple-CV
星標:2400,提交數(shù):2625,貢獻者:69
SimpleCV是一個針對開源機器視覺的架構(gòu),使用了OpenCV和Python編程語言。
29. GluonCV
星標:4300,提交數(shù):774,貢獻者:101
GluonCV提供了計算機視覺中最先進(SOTA)的深度學(xué)習(xí)模型。
30. Torchvision
星標:7500,提交數(shù):1286,貢獻者:334
Torchvision包包含了流行的數(shù)據(jù)集、模型架構(gòu)和計算機視覺中常用的圖像轉(zhuǎn)換方法。