Python開發(fā)者2017應(yīng)該關(guān)注的七個(gè)類庫
Django 依然是 Python 開發(fā)者值得信賴的庫 。然而,在 2016 年幾個(gè)還不太知名的庫引起了 Python 開發(fā)者的關(guān)注。在這篇博文中,我像大家揭示 7 個(gè) Python 類庫,其中不包括像 Django,F(xiàn)lask 等已廣為熟知的庫,這些類庫在 2017 年可能值得 Python 開發(fā)者參考.
#1 Arrow
移動(dòng)應(yīng)用程序無處不在,而且全球人類都參與其中 - 無論是游戲,社交媒體,健康監(jiān)控或其他。然而, Python 的標(biāo)準(zhǔn)數(shù)據(jù)/時(shí)間庫的問題讓它很難滿足現(xiàn)代應(yīng)用的需求,這些應(yīng)用的目標(biāo)受眾生活在不同的地區(qū)和國(guó)家。 Arrow 就是克服這個(gè)問題的類庫之一。它擁有簡(jiǎn)化創(chuàng)建,格式化,操作和轉(zhuǎn)換數(shù)據(jù),以及時(shí)間和時(shí)間戳的功能。
該庫解決了 Python 2 或 3 的支持 datetime 類型的需求。使用 Arrow,開發(fā)人員可以輕松地將一個(gè)時(shí)區(qū)轉(zhuǎn)換為另一個(gè)時(shí)區(qū)。此外,Arrow 的日期,時(shí)間和日歷模塊打開了一站式服務(wù)的國(guó)際化應(yīng)用程序的大門。
#2 TensorFlow
2015 年 11 月由 Google 推出的 TensorFlow 是一個(gè)用于數(shù)值計(jì)算的開源軟件庫。 自 TensorFlow 的推出才過去一年多的時(shí)間,但是這個(gè)庫已經(jīng)在 Python 開發(fā)人員中獲得了相當(dāng)大的人氣。 事實(shí)上, TensorFlow 是 最時(shí)髦 GitHub Python 資源庫 之一。
該庫可以在桌面,服務(wù)器或移動(dòng)設(shè)備中通過單個(gè) API 使用運(yùn)行在 GPU 和 CPUs 上的數(shù)據(jù)流圖能力。 TensorFlow 最初由 Google 機(jī)器智能研究機(jī)構(gòu)的研究人員和工程師開發(fā),用于機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)研究。 雖然 TensorFlow 在機(jī)器學(xué)習(xí)社區(qū)中掀起了一些小的波瀾,但它已經(jīng)被證明非常適合生產(chǎn)應(yīng)用程序。
#3 Zappa
最開始的時(shí)候是由 AWS Lambda 帶來了無服務(wù)架構(gòu)。而 Zappa 則被認(rèn)為是改進(jìn)了的 Python web 應(yīng)用部署的程序。 Rich Jones 是 Zappa 的主要作者,并且是 Gun.io 的 CTO, 他在一次采訪中說道 :“我相信無服務(wù)架構(gòu)(這意味著,系統(tǒng)沒有任何***基礎(chǔ)設(shè)施)是網(wǎng)絡(luò)應(yīng)用的未來”。
至于 Zappa,它讓所有 Python WSGI 的應(yīng)用在 AWS Lambda + API 網(wǎng)關(guān)上的部署變得輕而易舉。在 VPS 服務(wù) (類似 Linode ,PaaS服務(wù)的 Heroku )上擺脫依賴庫需要花費(fèi)成百上千的美元。簡(jiǎn)單來說,我們可以說 Zaapa 允許在云上以微服務(wù)部署,不會(huì)有任何與服務(wù)器管理相關(guān)的麻煩事。Zappa 同樣也是很快的,可擴(kuò)展的。
#4 Peewee
Peewee 是 Python 生態(tài)中簡(jiǎn)單的,富有表現(xiàn)力的 ORM ,它支持 SQLite,MySQL 和 PostgreSQL。數(shù)據(jù)庫經(jīng)常需要為應(yīng)用去使用擴(kuò)展的數(shù)據(jù)。不過,通過 ad hoc 連接串去 get 和 set 數(shù)據(jù)庫中的數(shù)據(jù)是一項(xiàng)非常有挑戰(zhàn)的任務(wù)。這種情況下,Peewee 就可以幫很大的忙了。這個(gè)庫對(duì)于開發(fā)者和數(shù)據(jù)庫工程師都是安全的,使用它可以以程序化的 Python 類來直觀地使用數(shù)據(jù)庫資源。
開發(fā)者們以前用 SQLAlchemy 已經(jīng)創(chuàng)建了一個(gè)數(shù)據(jù)庫,應(yīng)該會(huì)覺得使用 Peewee 創(chuàng)建數(shù)據(jù)庫是更容易的。另外,Peewee 一直以來都適用于 Flask web 框架。
點(diǎn)擊這里學(xué)習(xí)如何在 Peewee 中創(chuàng)建一個(gè)數(shù)據(jù)庫
# 6 Bokeh
你可能知道 Python 在數(shù)據(jù)可視化方面的一些類庫,比如 matplotlib 和 seaborn。然而,Bokeh 是一個(gè)專門設(shè)計(jì)可視化交互并用于現(xiàn)代的 Web 瀏覽器的展示。開發(fā)者可以利用 Bokeh 以類似于 D3.js 的方式創(chuàng)建***的可視媒體。除此之外,你可以利用非常大的或者流式的數(shù)據(jù)集來擴(kuò)展更強(qiáng)的表現(xiàn)交互的能力。
你可以通過 Bokeh 創(chuàng)建可視化端點(diǎn),儀表盤和數(shù)據(jù)應(yīng)用。開發(fā)者也可以利用 Bokeh 處理通過其他類庫,比如 Matplotlib, Seaborn 和 ggplot 創(chuàng)建的可視化圖形。Bokeh 也可以和 Jupyter Notebooks 很好的結(jié)合來用于研究領(lǐng)域。
#7 Blaze
Blaze 用于處理數(shù)據(jù)庫和分析查詢的陣列技術(shù)。當(dāng)對(duì)一個(gè)大到我們的電腦內(nèi)存不能存儲(chǔ)的數(shù)據(jù)集進(jìn)行分析時(shí),NumPy 和 Pandas 往往不能派上用場(chǎng)。這時(shí)開發(fā)者經(jīng)常求助于 PostgreSQL,MongoDB,Hadoop,Spark 和磁盤外存儲(chǔ)系統(tǒng)(PyTables and BColz)等等。
然而,理解每一個(gè)系統(tǒng)如何工作以及如何將數(shù)據(jù)整理成合適的形式是一個(gè)非常有挑戰(zhàn)性的工作。由于缺乏對(duì)于如何在新技術(shù)之間混合和遷移數(shù)據(jù)的認(rèn)識(shí),從數(shù)據(jù)分析中攫取有效的結(jié)論將是非常困難的。Blaze 通過提供一個(gè)對(duì)不同種類數(shù)據(jù)庫技術(shù)統(tǒng)一的接口以及遷移數(shù)據(jù)抽象化處理來解決這個(gè)難題。Blaze 對(duì)于表達(dá)計(jì)算是一個(gè)好的選擇。
盡管存在一些其他的不太知名但是有效的 Python 類庫,如 Gym + Universe , Boto3 , Hug , Scrapy , Beautiful Soup 等等。我只能選擇這幾個(gè)以便這篇博客有一個(gè)結(jié)尾。Python 開發(fā)者可以研究這些類庫看看是否符合他們的需要,再合理的選擇合適的類庫。