Java 線程和操作系統(tǒng)的線程有啥區(qū)別?
本文轉(zhuǎn)載自微信公眾號「飛天小牛肉」,作者飛天小牛肉。轉(zhuǎn)載本文請聯(lián)系飛天小牛肉公眾號。
不想看解釋的小伙伴可直接翻到文末尋找答案。
1. 用戶空間和內(nèi)核空間
關(guān)于內(nèi)核態(tài)和用戶態(tài)我們在 了解操作系統(tǒng)的那些事兒,從這篇文章開始 這篇文章中已經(jīng)詳細介紹過,這里不再過多贅述。
至于什么是系統(tǒng)空間和用戶空間也非常好理解:在操作系統(tǒng)中,內(nèi)存通常會被分成用戶空間(User space)與內(nèi)核空間(Kernel space)這兩個部分。當進程/線程運行在用戶空間時就處于用戶態(tài),運行在內(nèi)核空間時就處于內(nèi)核態(tài):
- 運行在內(nèi)核態(tài)的程序可以訪問用戶空間和內(nèi)核空間,或者說它可以訪問計算機的任何資源,不受限制,為所欲為,例如協(xié)調(diào) CPU 資源,分配內(nèi)存資源,提供穩(wěn)定的環(huán)境供應(yīng)用程序運行等
- 而應(yīng)用程序基本都是運行在用戶態(tài)的,或者說用戶態(tài)就是提供應(yīng)用程序運行的空間。運行在用戶態(tài)的程序只能訪問用戶空間
那為什么要區(qū)分用戶態(tài)和內(nèi)核態(tài)呢?
其實早期操作系統(tǒng)是不區(qū)分用戶態(tài)和內(nèi)核態(tài)的,也就是說應(yīng)用程序可以訪問任意內(nèi)存空間,如果程序不穩(wěn)定常常會讓系統(tǒng)崩潰,比如清除了操作系統(tǒng)的內(nèi)存數(shù)據(jù)。為此大佬們設(shè)計出了一套規(guī)則:對于那些比較危險的操作需要切到內(nèi)核態(tài)才能運行,比如 CPU、內(nèi)存、設(shè)備等資源管理器程序就應(yīng)該在內(nèi)核態(tài)運行,否則安全性沒有保證。
舉個例子,對于文件系統(tǒng)和數(shù)據(jù)來說,文件系統(tǒng)數(shù)據(jù)和管理就必須放在內(nèi)核態(tài),但是用戶的數(shù)據(jù)和管理可以放在用戶態(tài)。
用戶態(tài)的程序不能隨意操作內(nèi)核地址空間,這樣有效地防止了操作系統(tǒng)程序受到應(yīng)用程序的侵害。
那如果處于用戶態(tài)的程序想要訪問內(nèi)核空間的話怎么辦呢?就需要進行系統(tǒng)調(diào)用從用戶態(tài)切換到內(nèi)核態(tài)。
2. 操作系統(tǒng)線程
① 在用戶空間中實現(xiàn)線程
在早期的操作系統(tǒng)中,所有的線程都是在用戶空間下實現(xiàn)的,操作系統(tǒng)只能看到線程所屬的進程,而不能看到線程。
從我們開發(fā)者的角度來理解用戶級線程就是說:在這種模型下,我們需要自己定義線程的數(shù)據(jù)結(jié)構(gòu)、創(chuàng)建、銷毀、調(diào)度和維護等,這些線程運行在操作系統(tǒng)的某個進程內(nèi),然后操作系統(tǒng)直接對進程進行調(diào)度。
這種方式的好處一目了然,首先第一點,就是即使操作系統(tǒng)原生不支持線程,我們也可以通過庫函數(shù)來支持線程;第二點,線程的調(diào)度只發(fā)生在用戶態(tài),避免了操作系統(tǒng)從內(nèi)核態(tài)到用戶態(tài)的轉(zhuǎn)換開銷。
當然缺點也很明顯:由于操作系統(tǒng)看不見線程,不知道線程的存在,而 CPU 的時間片切換是以進程為維度的,所以如果進程中某個線程進行了耗時比較長的操作,那么由于用戶空間中沒有時鐘中斷機制,就會導(dǎo)致此進程中的其它線程因為得不到 CPU 資源而長時間的持續(xù)等待;另外,如果某個線程進行系統(tǒng)調(diào)用時比如缺頁中斷而導(dǎo)致了線程阻塞,此時操作系統(tǒng)也會阻塞住整個進程,即使這個進程中其它線程還在工作。
② 在內(nèi)核空間中實現(xiàn)線程
所謂內(nèi)核級線程就是運行在內(nèi)核空間的線程, 直接由內(nèi)核負責,只能由內(nèi)核來完成線程的調(diào)度。
幾乎所有的現(xiàn)代操作系統(tǒng),包括 Windows、Linux、Mac OS X 和 Solaris 等,都支持內(nèi)核線程。
每個內(nèi)核線程可以視為內(nèi)核的一個分身,這樣操作系統(tǒng)就有能力同時處理多件事情,支持多線程的內(nèi)核就叫做多線程內(nèi)核(Multi-Threads Kernel)。
從我們開發(fā)者的角度來理解內(nèi)核級線程就是說:我們可以直接使用操作系統(tǒng)中已經(jīng)內(nèi)置好的線程,線程的創(chuàng)建、銷毀、調(diào)度和維護等,都是直接由操作系統(tǒng)的內(nèi)核來實現(xiàn),我們只需要使用系統(tǒng)調(diào)用就好了,不需要像用戶級線程那樣自己設(shè)計線程調(diào)度等。
上圖畫的是 1:1 的線程模型,所謂線程模型,也就是用戶線程和內(nèi)核線程之間的關(guān)聯(lián)方式,線程模型當然不止 1:1 這一種,下面我們來詳細解釋以下這三種多線程模型:
下文翻譯自 https://www.cs.uic.edu/~jbell/CourseNotes/OperatingSystems/4_Threads.html
1)多對一線程模型:
- 在多對一模型中,多個用戶級線程映射到某一個內(nèi)核線程上
- 線程管理由用戶空間中的線程庫處理,這非常有效
- 但是,如果進行了阻塞系統(tǒng)調(diào)用,那么即使其他用戶線程能夠繼續(xù),整個進程也會阻塞
- 由于單個內(nèi)核線程只能在單個 CPU 上運行,因此多對一模型不允許在多個 CPU 之間拆分單個進程
從并發(fā)性角度來總結(jié)下,雖然多對一模型允許開發(fā)人員創(chuàng)建任意多的用戶線程,但是由于內(nèi)核只能一次調(diào)度一個線程,所以并未增加并發(fā)性?,F(xiàn)在已經(jīng)幾乎沒有操作系統(tǒng)來使用這個模型了,因為它無法利用多個處理核。
2)一對一線程模型:
- 一對一模型克服了多對一模型的問題
- 一對一模型創(chuàng)建一個單獨的內(nèi)核線程來處理每個用戶線程
- 但是,管理一對一模型的開銷更大,涉及更多開銷和減慢系統(tǒng)速度
- 此模型的大多數(shù)實現(xiàn)都限制了可以創(chuàng)建的線程數(shù)
從并發(fā)性角度來總結(jié)下,雖然一對一模型提供了更大的并發(fā)性,但是開發(fā)人員應(yīng)注意不要在應(yīng)用程序內(nèi)創(chuàng)建太多線程(有時系統(tǒng)可能會限制創(chuàng)建線程的數(shù)量),因為管理一對一模型的開銷更大。Windows (從 Win95 開始) 和 Linux 都實現(xiàn)了線程的一對一模型。
3)多對多線程模型:
- 多對多模型將任意數(shù)量的用戶線程復(fù)用到相同或更少數(shù)量的內(nèi)核線程上,結(jié)合了一對一和多對一模型的最佳特性
- 用戶對創(chuàng)建的線程數(shù)沒有限制
- 阻止內(nèi)核系統(tǒng)調(diào)用不會阻止整個進程
- 進程可以分布在多個處理器上
- 可以為各個進程分配可變數(shù)量的內(nèi)核線程,具體取決于存在的 CPU 數(shù)量和其他因素
3. Java 線程
在進入 Java 線程主題之前,有必要講解一下線程庫 Thread library 的概念。
在上面的模型介紹中,我們提到了通過線程庫來創(chuàng)建、管理線程,那么什么是線程庫呢?
線程庫就是為開發(fā)人員提供創(chuàng)建和管理線程的一套 API。
當然,線程庫不僅可以在用戶空間中實現(xiàn),還可以在內(nèi)核空間中實現(xiàn)。前者涉及僅在用戶空間內(nèi)實現(xiàn)的 API 函數(shù),沒有內(nèi)核支持。后者涉及系統(tǒng)調(diào)用,也就是說調(diào)用庫中的一個 API 函數(shù)將會導(dǎo)致對內(nèi)核的系統(tǒng)調(diào)用,并且需要具有線程庫支持的內(nèi)核。
下面簡單介紹下三個主要的線程庫:
1)POSIX Pthreads:可以作為用戶或內(nèi)核庫提供,作為 POSIX 標準的擴展
2)Win32 線程:用于 Window 操作系統(tǒng)的內(nèi)核級線程庫
3)Java 線程:Java 線程 API 通常采用宿主系統(tǒng)的線程庫來實現(xiàn),也就是說在 Win 系統(tǒng)上,Java 線程 API 通常采用 Win API 來實現(xiàn),在 UNIX 類系統(tǒng)上,采用 Pthread 來實現(xiàn)。
下面我們來詳細講解 Java 線程:
事實上,在 JDK 1.2 之前,Java 線程是基于稱為 "綠色線程"(Green Threads)的用戶級線程實現(xiàn)的,也就是說程序員大佬們?yōu)?JVM 開發(fā)了自己的一套線程庫或者說線程管理機制。
而在 JDK 1.2 及以后,JVM 選擇了更加穩(wěn)定且方便使用的操作系統(tǒng)原生的內(nèi)核級線程,通過系統(tǒng)調(diào)用,將線程的調(diào)度交給了操作系統(tǒng)內(nèi)核。而對于不同的操作系統(tǒng)來說,它們本身的設(shè)計思路基本上是完全不一樣的,因此它們各自對于線程的設(shè)計也存在種種差異,所以 JVM 中明確聲明了:虛擬機中的線程狀態(tài),不反應(yīng)任何操作系統(tǒng)中的線程狀態(tài)。
也就是說,在 JDK 1.2 及之后的版本中,Java 的線程很大程度上依賴于操作系統(tǒng)采用什么樣的線程模型,這點在不同的平臺上沒有辦法達成一致,JVM 規(guī)范中也并未限定 Java 線程需要使用哪種線程模型來實現(xiàn),可能是一對一,也可能是多對多或多對一。
總結(jié)來說,回答下文題,現(xiàn)今 Java 中線程的本質(zhì),其實就是操作系統(tǒng)中的線程,其線程庫和線程模型很大程度上依賴于操作系統(tǒng)(宿主系統(tǒng))的具體實現(xiàn),比如在 Windows 中 Java 就是基于 Wind32 線程庫來管理線程,且 Windows 采用的是一對一的線程模型。
References
Operating Systems - Threads:https://www.cs.uic.edu/~jbell/CourseNotes/OperatingSystems/4_Threads.html
Java 線程和操作系統(tǒng)線程的關(guān)系:https://blog.csdn.net/CringKong/article/details/79994511?utm_medium