那些被低估的Python庫
作者:機器學習與數(shù)據(jù)分析
在這篇文章中,我們想展示一些不同于流行的東西。這些都是深夜瀏覽GitHub的感悟,以及同事們分享的壓箱底東西。這些軟件包中的一些是非常獨特的,使用起來很有趣的Python包。
在這篇文章中,我們想展示一些不同于流行的東西。這些都是深夜瀏覽GitHub的感悟,以及同事們分享的壓箱底東西。這些軟件包中的一些是非常獨特的,使用起來很有趣的Python包。
混合派
- Knock Knock:從Python發(fā)送通知到移動設(shè)備、桌面或電子郵件。
- tqdm:可擴展的Python和CLI進度條,內(nèi)置對pandas的支持。
- Colorama:簡單的跨平臺彩色終端文本。
- pandas -log:提供熊貓基本操作的反饋。非常適合調(diào)試長管道鏈。
- Pandas-flavor:擴展pandas DataFrame/Series的簡單方法。
- More-Itertools:增加了類似于itertools的額外功能。
- streamlit:為機器學習項目創(chuàng)建應(yīng)用程序的簡單方法。
數(shù)據(jù)清理和操作
- ftfy:修復(fù)mojibake和Unicode文本中的其他故障。
- janitor:有很多很酷的功能來清理數(shù)據(jù)。
- Optimus:另一個數(shù)據(jù)清理包。
- Great-experctations:一個檢查數(shù)據(jù)是否符合預(yù)期的好工具。

數(shù)據(jù)探索和建模
- Pandas-profile:創(chuàng)建一個包含來自pandas DataFrame的統(tǒng)計數(shù)據(jù)的HTML報告。
- dabl:允許使用可視化和預(yù)處理進行數(shù)據(jù)探索。
- pydqc:允許比較兩個數(shù)據(jù)集之間的統(tǒng)計數(shù)據(jù)。
- pandas-summary:對panda DataFrames描述功能的擴展。
- pivottable-js:pands在jupyter notebook的拖放功能。
數(shù)據(jù)結(jié)構(gòu)
- Bounter:有效的計數(shù)器,使用有限(有界)的數(shù)量的內(nèi)存,無論數(shù)據(jù)大小。
- Python -bloomfilter:可擴展的Bloom Filter,使用Python實現(xiàn)。
- datasketch:提供概率數(shù)據(jù)結(jié)構(gòu),如LSH、加權(quán)MinHash、HyperLogLog等。
- ranges:Python的連續(xù)范圍、范圍集和范圍令數(shù)據(jù)結(jié)構(gòu)

性能檢查和優(yōu)化
- Py-spy:Python程序的采樣分析器。
- pyperf:用于運行Python基準測試的工具箱。
- snakeviz:一個瀏覽器內(nèi)的Python配置文件查看器,對jupyter notebook有很大的支持。
- Cachier:Python函數(shù)的持久、無延遲、本地和跨機緩存。
- Faiss:用于高效的相似性搜索和密集向量聚類的庫。
原文:
https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270
責任編輯:趙寧寧
來源:
今日頭條