學(xué)了這么久,你知道Python是如何運作的嗎?
作為一名機器學(xué)習(xí)工程師,我使用Python已經(jīng)一年多了。
最近出于興趣,我也開始學(xué)習(xí)C ++。接觸C++后,才意識到Python是多么容易和直觀。
我對Python與其他語言的不同之處及其工作機制愈加好奇。
于是,本文誕生。 本篇文章將嘗試討論Python的內(nèi)部工作機制。
來源:Pexels
Python最初是Guido Van Rossum在業(yè)余時開發(fā)的一個項目,于1991年首次發(fā)布。作為一門通用語言,Python為Netflix和Instagram等許多公司提供了強大支持。在一次采訪中,Guido將Python與Java/Swift等語言進行了比較,他表示Java/Swift對于日常工作即是編程的軟件開發(fā)人員是一個不錯的選擇,而Python針對的目標(biāo)用戶是日常工作與軟件開發(fā)無關(guān)的人,他們編寫代碼主要是為了處理數(shù)據(jù)。
在閱讀有關(guān)Python的文章時,經(jīng)常會遇到諸如“編譯型vs解釋型”、“字節(jié)碼vs機器碼”、“動態(tài)類型vs靜態(tài)類型”、“垃圾回收站”等詞語。維基百科將Python描述為:
Python是一種解釋型的高級通用性編程語言,具有動態(tài)類型和垃圾回收功能。
解釋型語言
用C / C ++編寫程序時,必須進行編譯。編譯是將人類可理解的代碼轉(zhuǎn)換為機器可理解的代碼即“機器代碼”。機器代碼是CPU可直接執(zhí)行指令的基本形式。成功編譯后,代碼生成一個可執(zhí)行文件。執(zhí)行此文件,代碼中的操作將逐步運行。
盡管也需要編譯這一步驟,但在大多數(shù)情況下,Python是一種解釋型語言,而非編譯型語言。首先將以.py文件編寫的Python代碼編譯為字節(jié)碼(后文將詳細(xì)討論),然后以.pyc或.pyo格式存儲。
Python將源代碼轉(zhuǎn)換為字節(jié)碼,而不像C ++等轉(zhuǎn)換為機器代碼。該字節(jié)碼是可由解釋器執(zhí)行的低級指令集。Python解釋器在大多數(shù)PC中安裝在/usr/local/bin/python3.8路徑下。字節(jié)碼指令在虛擬機而非CPU上執(zhí)行。
為什么選擇解釋型語言?
解釋型語言具有獨立于平臺的一大優(yōu)勢。只要Python字節(jié)碼和虛擬機版本相同,Python字節(jié)碼就可以在任何平臺(Windows,MacOS等)上執(zhí)行。
Python的另一個優(yōu)點是動態(tài)類型。在C ++等靜態(tài)類型語言中,必須先聲明變量類型,并在編譯時檢查所有差異(如添加字符串和整數(shù))。但在像Python這樣的強類型語言中,檢查變量類型和所執(zhí)行操作的有效性由解釋器來完成。
解釋型語言的缺點
動態(tài)類型提供給代碼很大的自由度,但同時提高了代碼的風(fēng)險性,有時會難以調(diào)試。
Python經(jīng)常被指責(zé)“速度慢”。這種說法是相對的,也存在很多爭議,但之所以“慢”是因為解釋器需要做額外工作來將字節(jié)碼指令轉(zhuǎn)換成可以在機器上執(zhí)行的指令形式。StackOverflow上的一個帖子對此的解釋更易理解:
如果你能用自己的母語和別人交談,那通常要比口譯員把你的語言翻譯成其他語言讓對方理解要快得多。
來源:Pexels
垃圾回收究竟是什么?
在早期編程語言中,內(nèi)存分配主要依靠手動操作。很多時候,當(dāng)變量不再使用或在程序的其他地方引用時,需要手動從內(nèi)存中清除。垃圾回收站代替人工進行此項工作,無需任何操作即可自動釋放空間。內(nèi)存管理有兩種方式:
簡化方式是跟蹤某對象的引用次數(shù)。當(dāng)該數(shù)字下降到0時,刪除該對象。這種方式被稱為“引用計數(shù)”。在Python中無法禁用此功能。
在對象引用自身或兩個對象相互引用的情況下,“生成垃圾回收”線程可以發(fā)揮作用。這是傳統(tǒng)的引用計數(shù)所無法解決的。
什么是__pycache__?
在個人項目中或GitHub上,可能經(jīng)??吹矫麨開_pycache__的文件夾被自動創(chuàng)建。
/文件夾-_pycache_-preprocess.cpython-36.pyc-preprocess.py
如您所見,自動創(chuàng)建的文件名與文件夾外部的文件名相同,均為_pycache_。.pyc擴展名表示該文件包含preprocess.py的字節(jié)碼。cpython表示解釋器的類型。CPython意味著解釋器是用C語言實現(xiàn)的。同樣,JPython是用Java實現(xiàn)的Python解釋器。
來源:diyitui
但為什么首先要創(chuàng)建文件夾? 因為這樣可以稍微提高Python程序的速度。 而另一種提高速度的方式是更改Python代碼,避免將其重新編譯為字節(jié)碼,從而節(jié)省時間。