自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="s3fan"></ruby>

<form id="s3fan"><optgroup id="s3fan"></optgroup></form>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

Linux 進(jìn)程、線程、文件描述符的底層原理

作者：Java互聯(lián)網(wǎng)架構(gòu) 2020-02-07 18:16:01

Linux 中的進(jìn)程其實(shí)就是一個(gè)數(shù)據(jù)結(jié)構(gòu)，順帶可以理解文件描述符、重定向、管道命令的底層工作原理，最后我們從操作系統(tǒng)的角度看看為什么說線程和進(jìn)程基本沒有區(qū)別。

說到進(jìn)程，恐怕面試中最常見的問題就是線程和進(jìn)程的關(guān)系了，那么先說一下答案：在 Linux 系統(tǒng)中，進(jìn)程和線程幾乎沒有區(qū)別。

Linux 中的進(jìn)程其實(shí)就是一個(gè)數(shù)據(jù)結(jié)構(gòu)，順帶可以理解文件描述符、重定向、管道命令的底層工作原理，最后我們從操作系統(tǒng)的角度看看為什么說線程和進(jìn)程基本沒有區(qū)別。

一、進(jìn)程是什么

首先，抽象地來說，我們的計(jì)算機(jī)就是這個(gè)東西：

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

這個(gè)大的矩形表示計(jì)算機(jī)的內(nèi)存空間，其中的小矩形代表進(jìn)程，左下角的圓形表示磁盤，右下角的圖形表示一些輸入輸出設(shè)備，比如鼠標(biāo)鍵盤顯示器等等。另外，注意到內(nèi)存空間被劃分為了兩塊，上半部分表示用戶空間，下半部分表示內(nèi)核空間。

用戶空間裝著用戶進(jìn)程需要使用的資源，比如你在程序代碼里開一個(gè)數(shù)組，這個(gè)數(shù)組肯定存在用戶空間;內(nèi)核空間存放內(nèi)核進(jìn)程需要加載的系統(tǒng)資源，這一些資源一般是不允許用戶訪問的。但是注意有的用戶進(jìn)程會(huì)共享一些內(nèi)核空間的資源，比如一些動(dòng)態(tài)鏈接庫等等。

我們用 C 語言寫一個(gè) hello 程序，編譯后得到一個(gè)可執(zhí)行文件，在命令行運(yùn)行就可以打印出一句 hello world，然后程序退出。在操作系統(tǒng)層面，就是新建了一個(gè)進(jìn)程，這個(gè)進(jìn)程將我們編譯出來的可執(zhí)行文件讀入內(nèi)存空間，然后執(zhí)行，最后退出。

你編譯好的那個(gè)可執(zhí)行程序只是一個(gè)文件，不是進(jìn)程，可執(zhí)行文件必須要載入內(nèi)存，包裝成一個(gè)進(jìn)程才能真正跑起來。進(jìn)程是要依靠操作系統(tǒng)創(chuàng)建的，每個(gè)進(jìn)程都有它的固有屬性，比如進(jìn)程號(hào)(PID)、進(jìn)程狀態(tài)、打開的文件等等，進(jìn)程創(chuàng)建好之后，讀入你的程序，你的程序才被系統(tǒng)執(zhí)行。

那么，操作系統(tǒng)是如何創(chuàng)建進(jìn)程的呢? 對(duì)于操作系統(tǒng)，進(jìn)程就是一個(gè)數(shù)據(jù)結(jié)構(gòu) ，我們直接來看 Linux 的源碼：

struct task_struct { // 進(jìn)程狀態(tài) long state; // 虛擬內(nèi)存結(jié)構(gòu)體 struct mm_struct *mm; // 進(jìn)程號(hào) pid_t pid; // 指向父進(jìn)程的指針 struct task_struct *parent; // 子進(jìn)程列表 struct list_head children; // 存放文件系統(tǒng)信息的指針 struct fs_struct *fs; // 一個(gè)數(shù)組，包含該進(jìn)程打開的文件指針 struct files_struct *files;};

task_struct 就是 Linux 內(nèi)核對(duì)于一個(gè)進(jìn)程的描述，也可以稱為「進(jìn)程描述符」。源碼比較復(fù)雜，我這里就截取了一小部分比較常見的。

我們主要聊聊 mm 指針和 files 指針。 mm 指向的是進(jìn)程的虛擬內(nèi)存，也就是載入資源和可執(zhí)行文件的地方; files 指針指向一個(gè)數(shù)組，這個(gè)數(shù)組里裝著所有該進(jìn)程打開的文件的指針。

二、文件描述符是什么

先說 files ，它是一個(gè)文件指針數(shù)組。一般來說，一個(gè)進(jìn)程會(huì)從 files[0] 讀取輸入，將輸出寫入 files[1] ，將錯(cuò)誤信息寫入 files[2] 。

舉個(gè)例子，以我們的角度 C 語言的 printf 函數(shù)是向命令行打印字符，但是從進(jìn)程的角度來看，就是向 files[1] 寫入數(shù)據(jù);同理， scanf 函數(shù)就是進(jìn)程試圖從 files[0] 這個(gè)文件中讀取數(shù)據(jù)。

每個(gè)進(jìn)程被創(chuàng)建時(shí)， files 的前三位被填入默認(rèn)值，分別指向標(biāo)準(zhǔn)輸入流、標(biāo)準(zhǔn)輸出流、標(biāo)準(zhǔn)錯(cuò)誤流。我們常說的「文件描述符」就是指這個(gè)文件指針數(shù)組的索引，所以程序的文件描述符默認(rèn)情況下 0 是輸入，1 是輸出，2 是錯(cuò)誤。

我們可以重新畫一幅圖：

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

對(duì)于一般的計(jì)算機(jī)，輸入流是鍵盤，輸出流是顯示器，錯(cuò)誤流也是顯示器，所以現(xiàn)在這個(gè)進(jìn)程和內(nèi)核連了三根線。因?yàn)橛布际怯蓛?nèi)核管理的，我們的進(jìn)程需要通過「系統(tǒng)調(diào)用」讓內(nèi)核進(jìn)程訪問硬件資源。

PS：不要忘了，Linux 中一切都被抽象成文件，設(shè)備也是文件，可以進(jìn)行讀和寫。

如果我們寫的程序需要其他資源，比如打開一個(gè)文件進(jìn)行讀寫，這也很簡單，進(jìn)行系統(tǒng)調(diào)用，讓內(nèi)核把文件打開，這個(gè)文件就會(huì)被放到 files 的第 4 個(gè)位置，對(duì)應(yīng)文件描述符 3：

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

明白了這個(gè)原理，輸入重定向就很好理解了，程序想讀取數(shù)據(jù)的時(shí)候就會(huì)去 files[0] 讀取，所以我們只要把 files[0] 指向一個(gè)文件，那么程序就會(huì)從這個(gè)文件中讀取數(shù)據(jù)，而不是從鍵盤：

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

同理，輸出重定向就是把 files[1] 指向一個(gè)文件，那么程序的輸出就不會(huì)寫入到顯示器，而是寫入到這個(gè)文件中：

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

錯(cuò)誤重定向也是一樣的，就不再贅述。

管道符其實(shí)也是異曲同工，把一個(gè)進(jìn)程的輸出流和另一個(gè)進(jìn)程的輸入流接起一條「管道」，數(shù)據(jù)就在其中傳遞，不得不說這種設(shè)計(jì)思想真的很巧妙：

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

到這里，你可能也看出「Linux 中一切皆文件」設(shè)計(jì)思路的高明了，不管是設(shè)備、另一個(gè)進(jìn)程、socket 套接字還是真正的文件，全部都可以讀寫，統(tǒng)一裝進(jìn)一個(gè)簡單的 files 數(shù)組，進(jìn)程通過簡單的文件描述符訪問相應(yīng)資源，具體細(xì)節(jié)交于操作系統(tǒng)，有效解耦，優(yōu)美高效。

三、線程是什么

首先要明確的是，多進(jìn)程和多線程都是并發(fā)，都可以提高處理器的利用效率，所以現(xiàn)在的關(guān)鍵是，多線程和多進(jìn)程有啥區(qū)別。

為什么說 Linux 中線程和進(jìn)程基本沒有區(qū)別呢，因?yàn)閺?Linux 內(nèi)核的角度來看，并沒有把線程和進(jìn)程區(qū)別對(duì)待。

我們知道系統(tǒng)調(diào)用 fork() 可以新建一個(gè)子進(jìn)程，函數(shù) pthread() 可以新建一個(gè)線程。但無論線程還是進(jìn)程，都是用 task_struct 結(jié)構(gòu)表示的，唯一的區(qū)別就是共享的數(shù)據(jù)區(qū)域不同。

換句話說，線程看起來跟進(jìn)程沒有區(qū)別，只是線程的某些數(shù)據(jù)區(qū)域和其父進(jìn)程是共享的，而子進(jìn)程是拷貝副本，而不是共享。就比如說， mm 結(jié)構(gòu)和 files 結(jié)構(gòu)在線程中都是共享的，我畫兩張圖你就明白了：

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

「圖文結(jié)合」Linux 進(jìn)程、線程、文件描述符的底層原理

所以說，我們的多線程程序要利用鎖機(jī)制，避免多個(gè)線程同時(shí)往同一區(qū)域?qū)懭霐?shù)據(jù)，否則可能造成數(shù)據(jù)錯(cuò)亂。

那么你可能問，既然進(jìn)程和線程差不多，而且多進(jìn)程數(shù)據(jù)不共享，即不存在數(shù)據(jù)錯(cuò)亂的問題，為什么多線程的使用比多進(jìn)程普遍得多呢 ?

因?yàn)楝F(xiàn)實(shí)中數(shù)據(jù)共享的并發(fā)更普遍呀，比如十個(gè)人同時(shí)從一個(gè)賬戶取十元，我們希望的是這個(gè)共享賬戶的余額正確減少一百元，而不是希望每人獲得一個(gè)賬戶的拷貝，每個(gè)拷貝賬戶減少十元。

當(dāng)然，必須要說明的是，只有 Linux 系統(tǒng)將線程看做共享數(shù)據(jù)的進(jìn)程，不對(duì)其做特殊看待，其他的很多操作系統(tǒng)是對(duì)線程和進(jìn)程區(qū)別對(duì)待的，線程有其特有的數(shù)據(jù)結(jié)構(gòu)，我個(gè)人認(rèn)為不如 Linux 的這種設(shè)計(jì)簡潔，增加了系統(tǒng)的復(fù)雜度。

在 Linux 中新建線程和進(jìn)程的效率都是很高的，對(duì)于新建進(jìn)程時(shí)內(nèi)存區(qū)域拷貝的問題，Linux 采用了 copy-on-write 的策略優(yōu)化，也就是并不真正復(fù)制父進(jìn)程的內(nèi)存空間，而是等到需要寫操作時(shí)才去復(fù)制。所以 Linux 中新建進(jìn)程和新建線程都是很迅速的。

責(zé)任編輯：武曉燕來源： Java互聯(lián)網(wǎng)架構(gòu)

進(jìn)程線程底層原理

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<var id="ywba8"><strike id="ywba8"></strike></var>