Python標準庫——走馬觀花
Python的一大好處在于它有一套很有用的標準庫(standard library)。標準庫是隨著Python一起安裝在你的電腦中的,是Python的一部分 (當然也有特殊情況。有些場合會因為系統(tǒng)安全性的要求,不使用全部的標準庫,比如說Google App Engine)。
利用已有的類(class)和函數(shù)(function)進行開發(fā),可以省去你從頭寫所有程序的苦惱。這些標準庫就是蓋房子已經燒好的磚,要比你自己去燒磚來得便捷得多。
我將根據我個人的使用經驗中,先挑選出標準庫下面三個方面的包(package)介紹,以說明標準庫的強大功能:
Python增強;系統(tǒng)互動;網絡
***類:Python增強
Python自身的已有的一些功能可以隨著標準庫的使用而得到增強。
1) 文字處理
Python的string類提供了對字符串進行處理的方法。但Python并不止步于此。通過標準庫中的re包,Python實現(xiàn)了對正則表達式(regular expression)的支持。Python的正則表達式可以和Perl以及Linux bash的正則表達相媲美。
(正則表達式通過自定義的模板在文本中搜索或替換符合該模板的字符串。比如你可以搜索一個文本中所有的數(shù)字。正則表達式的關鍵在于根據自己的需要構成模板。)
此外,Python標準庫還為字符串的輸出提供更加豐富的格式, 比如: string包,textwrap包。
2) 數(shù)據對象
我們之前的快速教程介紹了表(list), 字典(dictionary)等數(shù)據對象。它們各自有不同的特征,適用于不同場合的對數(shù)據的組織和管理。Python的標準庫定義了更多的數(shù)據對象,比如說數(shù)組(array),隊列(Queue)。這些數(shù)據對象也分別有各自的特點和功能。一個熟悉數(shù)據結構(data structure)的Python用戶可以在這些包中找到自己需要的數(shù)據結構。
此外,我們也會經常使用copy包,以復制對象。
3) 日期和時間
日期和時間的管理并不復雜,但容易犯錯。Python的標準庫中對日期和時間的管理頗為完善(利用time包管理時間,利用datetime包管理日期和時間),你不僅可以進行日期時間的查詢和變換(比如:2012年7月18日對應的是星期幾),還可以對日期時間進行運算(比如2000.1.1 13:00的378小時之后是什么日期,什么時間)。通過這些標準庫,還可以根據需要控制日期時間輸出的文本格式(比如:輸出’2012-7-18‘還是'18 Jul 2012')
4) 數(shù)學運算
標準庫中,Python定義了一些新的數(shù)字類型(decimal包, fractions包), 以彌補之前的數(shù)字類型(integer, float)可能的不足。標準庫還包含了random包,用于處理隨機數(shù)相關的功能(產生隨機數(shù),隨機取樣等)。math包補充了一些重要的數(shù)學常數(shù)和數(shù)學函數(shù),比如pi,三角函數(shù)等等。
(盡管numpy并不是標準庫中的包,但它的數(shù)組運算的良好支持,讓它在基于Python的科研和計算方面得到相當廣泛的應用,可以適當關注。)
5) 存儲
之前我們的快速教程中,只提及了文本的輸入和輸出。實際上,Python可以輸入或輸出任意的對象。這些對象可以通過標準庫中的pickle包轉換成為二進制格式(binary),然后存儲于文件之中,也可以反向從二進制文件中讀取對象。
此外,標準庫中還支持基本的數(shù)據庫功能(sqlite3包)。XML和csv格式的文件也有相應的處理包。
#p#
第二類:系統(tǒng)互動
系統(tǒng)互動,主要指Python和操作系統(tǒng)(operate system)、文件系統(tǒng)(file system)的互動。Python可以實現(xiàn)一個操作系統(tǒng)的許多功能。它能夠像bash腳本那樣管理操作系統(tǒng),這也是Python有時被成為腳本語言的原因。
1) Python運行控制
sys包被用于管理Python自身的運行環(huán)境。Python是一個解釋器(interpreter), 也是一個運行在操作系統(tǒng)上的程序。我們可以用sys包來控制這一程序運行的許多參數(shù),比如說Python運行所能占據的內存和CPU, Python所要掃描的路徑等。另一個重要功能是和Python自己的命令行互動,從命令行讀取命令和參數(shù)。
2) 操作系統(tǒng)
如果說Python構成了一個小的世界,那么操作系統(tǒng)就是包圍這個小世界的大世界。Python與操作系統(tǒng)的互動可以讓Python在自己的小世界里管理整個大世界。
os包是Python與操作系統(tǒng)的接口。我們可以用os包來實現(xiàn)操作系統(tǒng)的許多功能,比如管理系統(tǒng)進程,改變當前路徑(相當于’cd‘),改變文件權限等,建立。但要注意,os包是建立在操作系統(tǒng)的平臺上的,許多功能在Windows系統(tǒng)上是無法實現(xiàn)的。另外,在使用os包中,要注意其中的有些功能已經被其他的包取代。
我們通過文件系統(tǒng)來管理磁盤上儲存的文件。查找、刪除,復制文件,以及列出文件列表等都是常見的文件操作。這些功能經??梢栽诓僮飨到y(tǒng)中看到(比如ls, mv, cp等Linux命令),但現(xiàn)在可以通過Python標準庫中的glob包、shutil包、os.path包、以及os包的一些函數(shù)等,在Python內部實現(xiàn)。
subprocess包被用于執(zhí)行外部命令,其功能相當于我們在操作系統(tǒng)的命令行中輸入命令以執(zhí)行,比如常見的系統(tǒng)命令'ls'或者'cd',還可以是任意可以在命令行中執(zhí)行的程序。
4) 線程與進程
Python支持多線程(threading包)運行和多進程(multiprocessing包)運行。通過多線程和多進程,可以提高系統(tǒng)資源的利用率,提高計算機的處理速度。Python在這些包中,附帶有相關的通信和內存管理工具。此外,Python還支持類似于UNIX的signal系統(tǒng),以實現(xiàn)程序之間的粗糙的信號通信。
#p#
第三類:網絡
現(xiàn)在,網絡功能的強弱很大程度上決定了一個語言的成功與否。從Ruby, JavaScript, php身上都可以感受到這一點。Python的標準庫對互聯(lián)網開發(fā)的支持并不充分,這也是Django等基于Python的項目的出發(fā)點: 增強Python在網絡方面的應用功能。這些項目取得了很大的成功,也是許多人愿意來學習Python的一大原因。但應注意到,這些基于Python的項目也是建立在Python標準庫的基礎上的。
1) 基于socket層的網絡應用
socket是網絡可編程部分的底層。通過socket包,我們可以直接管理socket,比如說將socket賦予給某個端口(port),連接遠程端口,以及通過連接傳輸數(shù)據。我們也可以利用SocketServer包更方便地建立服務器。
通過與多線程和多進程配合,建立多線程或者多進程的服務器,可以有效提高服務器的工作能力。此外,通過asyncore包實現(xiàn)異步處理,也是改善服務器性能的一個方案。
2) 互聯(lián)網應用
在實際應用中,網絡的很多底層細節(jié)(比如socket)都是被高層的協(xié)議隱藏起來的。建立在socket之上的http協(xié)議實際上更容易也更經常被使用。http通過request/responce的模式建立連接并進行通信,其信息內容也更容易理解。Python標準庫中有http的服務器端和客戶端的應用支持(BaseHTTPServer包; urllib包, urllib2包), 并且可以通過urlparse包對URL(URL實際上說明了網絡資源所在的位置)進行理解和操作。
這些內容可以說非常粗糙,只希望能為大家提供一個了解標準庫的入口。歡迎大家一起分享標準庫的使用經驗。
原文鏈接:http://www.cnblogs.com/vamei/archive/2012/07/18/2597212.html
【編輯推薦】