如何選擇一個(gè)適合自己的開源項(xiàng)目來(lái)閱讀
人們都說(shuō), 閱讀源碼是提高編程水平的一個(gè)極好的方法, 但是如何找到一個(gè)適合自己閱讀的源碼, 就蛋疼的很。 優(yōu)秀的開源項(xiàng)目非常多, 肯定是看不完的。 而且如果沒有一個(gè)明確的目的, 只是因?yàn)榛鹁涂矗?則事倍功半。
我更像一個(gè)后臺(tái)開發(fā)程序員, 所以以下觀點(diǎn)都基于后臺(tái)程序員的視角出發(fā)。
從 Node.js 和 Tornado 出發(fā)
在幾個(gè)月前, 我學(xué)習(xí)了 Tornado 框架并用來(lái)做了一個(gè)項(xiàng)目; 而 Node.js 則是最近幾天才開始學(xué)的。 所以很可能會(huì)有說(shuō)的不嚴(yán)謹(jǐn)?shù)牡胤健?/p>
Tornado 是一個(gè)異步非阻塞服務(wù)器應(yīng)用與輕量級(jí)Web框架的結(jié)合體。 Node.js 則是一個(gè)開源跨平臺(tái)的運(yùn)行環(huán)境(runtime environment)。 在我看來(lái), Node.js 基本上就是一個(gè)服務(wù)器應(yīng)用了, 因?yàn)檫@一部分和 Tornado 的服務(wù)器部分幾乎是一模一樣。
我們的問題主要是應(yīng)該選擇什么樣的開源代碼來(lái)閱讀, 目前為止, 我們可以選擇的項(xiàng)目有Tornado和Node.js了。 先不著急做出決定, 繼續(xù)向深處探索一番。 首先化簡(jiǎn)問題, 因?yàn)?Node.js 的優(yōu)勢(shì)并非僅僅是異步非阻塞提供的高性能, 還有很多其他的東西, 我們暫時(shí)不管那些其他的部分。
-
Tornado = AIO Server + Web Framework
-
Node.js = AIO Server
如果學(xué)習(xí)過操作系統(tǒng), 就會(huì)知道 Linux 下這兩個(gè)程序之所以達(dá)到如此高性能的效果, 歸功于 Linux 2。6 Kernel 提供的epoll。 我的思路是, Node.js 如果在 Linux 下運(yùn)行, 一定會(huì)調(diào)用操作系統(tǒng)提供的 epoll; 如果在 Windows 下運(yùn)行, 一定會(huì)調(diào)用操作系統(tǒng)提供的 IOCP。
順著這個(gè)思路, 我發(fā)現(xiàn)了 libuv 和 pyuv 這兩個(gè)開源項(xiàng)目。
-
libuv: 一般認(rèn)為, libuv 是因 nodejs 而生。 libuv的作用是對(duì)用戶隱藏操作系統(tǒng)的差異, 封裝Linux的libev和 windows 的 IOCP 等等, 提供跨平臺(tái)的異步操作庫(kù)。
-
pyuv: 給 Python 提供一個(gè)調(diào)用 libuv 的接口
屢清關(guān)系
上面提到了nodejs, tornado, libuv, pyuv, libev, IOCP 這些概念(項(xiàng)目), 他們中大部分都可以找到開源代碼, 如果想要從中選擇出合適自己學(xué)習(xí)的項(xiàng)目, 最好的辦法是先縷清他們的關(guān)系。
首先, Tornado 和 Node.js 都可以用來(lái)做網(wǎng)站后臺(tái)服務(wù)器應(yīng)用。 而 Tornado 更是提供了一個(gè) Web 框架。
Tornado 的 Web 框架提供了視圖和路由功能, 利用這一點(diǎn)我們可以很容易寫出一個(gè) MVC 模式的 Web 應(yīng)用。 對(duì)于Web框架來(lái)說(shuō), 他直接從服務(wù)器應(yīng)用拿到用戶的 request, 處理完畢后得到一個(gè) response, 直接給回服務(wù)器就可以了, 是不需要了解 request 如何傳輸過來(lái)以及 response 如何返回給用戶的細(xì)節(jié)的。
圖片: web框架與服務(wù)器的關(guān)系
由于同時(shí)會(huì)有很多客戶端向服務(wù)器發(fā)起請(qǐng)求, 服務(wù)器要盡快處理這些請(qǐng)求, 提高性能一般是讓cpu在單位時(shí)間里面盡量可以處理更多的I/O請(qǐng)求, 方法一般就是采用阻塞的多線程, 或者非阻塞的單線程(當(dāng)然也可以多線程或者多進(jìn)程)。
圖片: 服務(wù)器與客戶端的關(guān)系
無(wú)論是采用哪一種I/O模型, 都要有操作系統(tǒng)的支持, 如果CPU沒有中斷功能, 操作系統(tǒng)就沒有鎖的功能, 也就沒有信號(hào)量, 沒有Monitor等一系列同步機(jī)制。
對(duì)于 Tornado 來(lái)說(shuō), Python 解釋器提供了上述一系列的同步機(jī)制。 因此 Tornado 到底能用什么樣的 I/O 模型, 直接取決于 Python 解釋器。
而 Python 解釋器是運(yùn)行在操作系統(tǒng)之上, 如果操作系統(tǒng)不提供鎖, 那么解釋器也無(wú)法做出一把鎖。 因此 Tornado 到底能用什么樣的 I/O 模型, 間接取決于操作系統(tǒng)。
我想 Node.js 也是一樣的道理。
圖片: 服務(wù)器與操作系統(tǒng)的關(guān)系
得出結(jié)論
-
如果想知道一個(gè)網(wǎng)站的框架是如何將路由, 視圖(html, css, js之類), 數(shù)據(jù)處理拼在一起的, 那么可以閱讀 Tornado 源碼中的 Web 框架部分。
-
如果想知道同時(shí)有很多很多的 request 到來(lái), 服務(wù)器應(yīng)用是如何利用操作系統(tǒng)提供的接口來(lái)完成高并發(fā)處理的, 可以閱讀 Tornado 的服務(wù)器部分或者 Node.js的源碼
-
如果想知道, 不同的操作系統(tǒng)提供了不同的接口, 如何在這個(gè)基礎(chǔ)上構(gòu)建出一個(gè)跨平臺(tái)的統(tǒng)一接口, 可以閱讀 libuv 的源碼
-
如果想知道在 Linux 操作系統(tǒng)下, 到底是如何實(shí)現(xiàn)這些I/O接口的, 可以閱讀 libev 的源碼
-
如果想知道如何利用 libuv, 在 Python 下也可以調(diào)用跨平臺(tái) I/O 接口, 可以閱讀 pyuv 的源碼
不僅如此, 我們由結(jié)論還可以知道更多: 如果想看 libuv 的源碼, 知道 libuv 是如何實(shí)現(xiàn)的, 首先得會(huì)用它。 只有知道它的作用, 看起源碼來(lái)才有一個(gè)目的性。 要想知道如何使用 libuv, 得參考其上面一層的 Tornado 源碼中的很小一部分, 或者查閱 libuv 的文檔。
選擇源碼的一般方法
-
列出一些感興趣的關(guān)鍵字
-
對(duì)關(guān)鍵字的上層和下層進(jìn)行了解
-
梳理出整個(gè)關(guān)系圖
-
得出結(jié)論, 做出選擇
經(jīng)過剛剛幾個(gè)步驟, 我們由對(duì) Tornado 和 Node.js 的一些模糊的認(rèn)識(shí), 逐漸梳理出從用戶發(fā)起請(qǐng)求, 到操作系統(tǒng)甚至硬件層面的一條比較清晰的路線。 雖然一行源碼都還沒看, 已經(jīng)知道了我們看不同的源碼, 分別能學(xué)到什么知識(shí)。 在這個(gè)基礎(chǔ)上, 選擇適合自己當(dāng)前需求的源碼來(lái)閱讀, 就能事半功倍了。
原文:http://jecvay.com/2015/09/how-to-choose-a-open-source-project-to-read.html 作者: Jecvay