自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Java多線程:從基本概念到避坑指南

開發(fā) 后端
多核的機器,現(xiàn)在已經(jīng)非常常見了。即使是一塊手機,也都配備了強勁的多核處理器。通過多進程和多線程的手段,就可以讓多個CPU同時工作,來加快任務的執(zhí)行。

[[424440]]

多核的機器,現(xiàn)在已經(jīng)非常常見了。即使是一塊手機,也都配備了強勁的多核處理器。通過多進程和多線程的手段,就可以讓多個CPU同時工作,來加快任務的執(zhí)行。

多線程,是編程中一個比較高級的話題。由于它涉及到共享資源的操作,所以在編碼時非常容易出現(xiàn)問題。Java的concurrent包,提供了非常多的工具,來幫助我們簡化這些變量的同步,但學習應用之路依然充滿了曲折。

本篇文章,將簡單的介紹一下Java中多線程的基本知識。然后著重介紹一下初學者在多線程編程中一些最容易出現(xiàn)問題的地方,很多都是血淚經(jīng)驗。規(guī)避了這些坑,就相當于規(guī)避了90%兇殘的多線程bug。

1. 多線程基本概念

1.1 輕量級進程

在JVM中,一個線程,其實是一個輕量級進程(LWP)。所謂的輕量級進程,其實是用戶進程調(diào)用系統(tǒng)內(nèi)核,所提供的一套接口。實際上,它還要調(diào)用更加底層的內(nèi)核線程(KLT)。

實際上,JVM的線程創(chuàng)建銷毀以及調(diào)度等,都是依賴于操作系統(tǒng)的。如果你看一下Thread類里面的多個函數(shù),你會發(fā)現(xiàn)很多都是native的,直接調(diào)用了底層操作系統(tǒng)的函數(shù)。

下圖是JVM在Linux上簡單的線程模型。

可以看到,不同的線程在進行切換的時候,會頻繁在用戶態(tài)和內(nèi)核態(tài)進行狀態(tài)轉(zhuǎn)換。這種切換的代價是比較大的,也就是我們平常所說的上下文切換(Context Switch)。

1.2 JMM

在介紹線程同步之前,我們有必要介紹一個新的名詞,那就是JVM的內(nèi)存模型JMM。

JMM并不是說堆、metaspace這種內(nèi)存的劃分,它是一個完全不同的概念,指的是與線程相關的Java運行時線程內(nèi)存模型。

由于Java代碼在執(zhí)行的時候,很多指令都不是原子的,如果這些值的執(zhí)行順序發(fā)生了錯位,就會獲得不同的結(jié)果。比如,i++的動作就可以翻譯成以下的字節(jié)碼。

  1. getfield      // Field value:I 
  2. iconst_1 
  3. iadd 
  4. putfield      // Field value:I 

這還只是代碼層面的。如果再加上CPU每核的各級緩存,這個執(zhí)行過程會變得更加細膩。如果我們希望執(zhí)行完i++之后,再執(zhí)行i--,僅靠初級的字節(jié)碼指令,是無法完成的。我們需要一些同步手段。

上圖就是JMM的內(nèi)存模型,它分為主存儲器(Main Memory)和工作存儲器(Working Memory)兩種。我們平常在Thread中操作這些變量,其實是操作的主存儲器的一個副本。當修改完之后,還需要重新刷到主存儲器上,其他的線程才能夠知道這些變化。

1.3 Java中常見的線程同步方式

為了完成JMM的操作,完成線程之間的變量同步,Java提供了非常多的同步手段。

  1. Java的基類Object中,提供了wait和notify的原語,來完成monitor之間的同步。不過這種操作我們在業(yè)務編程中很少遇見
  2. 使用synchronized對方法進行同步,或者鎖住某個對象以完成代碼塊的同步
  3. 使用concurrent包里面的可重入鎖。這套鎖是建立在AQS之上的
  4. 使用volatile輕量級同步關鍵字,實現(xiàn)變量的實時可見性
  5. 使用Atomic系列,完成自增自減
  6. 使用ThreadLocal線程局部變量,實現(xiàn)線程封閉
  7. 使用concurrent包提供的各種工具,比如LinkedBlockingQueue來實現(xiàn)生產(chǎn)者消費者。本質(zhì)還是AQS
  8. 使用Thread的join,以及各種await方法,完成并發(fā)任務的順序執(zhí)行

從上面的描述可以看出,多線程編程要學的東西可實在太多了。幸運的是,同步方式雖然千變?nèi)f化,但我們創(chuàng)建線程的方式卻沒幾種。

第一類就是Thread類。大家都知道有兩種實現(xiàn)方式。第一可以繼承Thread覆蓋它的run方法;第二種是實現(xiàn)Runnable接口,實現(xiàn)它的run方法;而第三種創(chuàng)建線程的方法,就是通過線程池。

其實,到最后,就只有一種啟動方式,那就是Thread。線程池和Runnable,不過是一種封裝好的快捷方式罷了。

多線程這么復雜,這么容易出問題,那常見的都有那些問題,我們又該如何避免呢?下面,我將介紹10個高頻出現(xiàn)的坑,并給出解決方案。

2. 避坑指南

2.1. 線程池打爆機器

首先,我們聊一個非常非常低級,但又產(chǎn)生了嚴重后果的多線程錯誤。

通常,我們創(chuàng)建線程的方式有Thread,Runnable和線程池三種。隨著Java1.8的普及,現(xiàn)在最常用的就是線程池方式。

有一次,我們線上的服務器出現(xiàn)了僵死,就連遠程ssh,都登錄不上,只能無奈的重啟。大家發(fā)現(xiàn),只要啟動某個應用,過不了幾分鐘,就會出現(xiàn)這種情況。最終定位到了幾行讓人啼笑皆非的代碼。

有位對多線程不太熟悉的同學,使用了線程池去異步處理消息。通常,我們都會把線程池作為類的靜態(tài)變量,或者是成員變量。但是這位同學,卻將它放在了方法內(nèi)部。也就是說,每當有一個請求到來的時候,都會創(chuàng)建一個新的線程池。當請求量一增加,系統(tǒng)資源就被耗盡,最終造成整個機器的僵死。

  1. void realJob(){ 
  2.     ThreadPoolExecutor exe = new ThreadPoolExecutor(...); 
  3.     exe.submit(new Runnable(){...}) 

這種問題如何去避免?只能通過代碼review。所以多線程相關的代碼,哪怕是非常簡單的同步關鍵字,都要交給有經(jīng)驗的人去寫。即使沒有這種條件,也要非常仔細的對這些代碼進行review。

2.2. 鎖要關閉

相比較synchronized關鍵字加的獨占鎖,concurrent包里面的Lock提供了更多的靈活性??梢愿鶕?jù)需要,選擇公平鎖與非公平鎖、讀鎖與寫鎖。

但Lock用完之后是要關閉的,也就是lock和unlock要成對出現(xiàn),否則就容易出現(xiàn)鎖泄露,造成了其他的線程永遠了拿不到這個鎖。

如下面的代碼,我們在調(diào)用lock之后,發(fā)生了異常,try中的執(zhí)行邏輯將被中斷,unlock將永遠沒有機會執(zhí)行。在這種情況下,線程獲取的鎖資源,將永遠無法釋放。

  1. private final Lock lock = new ReentrantLock(); 
  2. void doJob(){ 
  3.     try{ 
  4.         lock.lock(); 
  5.         //發(fā)生了異常 
  6.         lock.unlock(); 
  7.     }catch(Exception e){ 
  8.     } 

正確的做法,就是將unlock函數(shù),放到finally塊中,確保它總是能夠執(zhí)行。

由于lock也是一個普通的對象,是可以作為函數(shù)的參數(shù)的。如果你把lock在函數(shù)之間傳來傳去的,同樣會有時序邏輯混亂的情況。在平時的編碼中,也要避免這種把lock當參數(shù)的情況。

2.3. wait要包兩層

Object作為Java的基類,提供了四個方法wait wait(timeout) notify notifyAll ,用來處理線程同步問題,可以看出wait等函數(shù)的地位是多么的高大。在平常的工作中,寫業(yè)務代碼的同學使用這些函數(shù)的機率是比較小的,所以一旦用到很容易出問題。

但使用這些函數(shù)有一個非常大的前提,那就是必須使用synchronized進行包裹,否則會拋出IllegalMonitorStateException。比如下面的代碼,在執(zhí)行的時候就會報錯。

  1. final Object condition = new Object(); 
  2. public void func(){ 
  3.  condition.wait(); 

類似的方法,還有concurrent包里的Condition對象,使用的時候也必須出現(xiàn)在lock和unlock函數(shù)之間。

為什么在wait之前,需要先同步這個對象呢?因為JVM要求,在執(zhí)行wait之時,線程需要持有這個對象的monitor,顯然同步關鍵字能夠完成這個功能。

但是,僅僅這么做,還是不夠的,wait函數(shù)通常要放在while循環(huán)里才行,JDK在代碼里做了明確的注釋。

重點:這是因為,wait的意思,是在notify的時候,能夠向下執(zhí)行邏輯。但在notify的時候,這個wait的條件可能已經(jīng)是不成立的了,因為在等待的這段時間里條件條件可能發(fā)生了變化,需要再進行一次判斷,所以寫在while循環(huán)里是一種簡單的寫法。

  1. final Object condition = new Object(); 
  2. public void func(){ 
  3.  synchronized(condition){ 
  4.   while(<條件成立>){ 
  5.    condition.wait(); 
  6.   } 
  7.  } 

帶if條件的wait和notify要包兩層,一層synchronized,一層while,這就是wait等函數(shù)的正確用法。

2.4. 不要覆蓋鎖對象

使用synchronized關鍵字時,如果是加在普通方法上的,那么鎖的就是this對象;如果是加載static方法上的,那鎖的就是class。除了用在方法上,synchronized還可以直接指定要鎖定的對象,鎖代碼塊,達到細粒度的鎖控制。

如果這個鎖的對象,被覆蓋了會怎么樣?比如下面這個。

  1. List listeners = new ArrayList(); 
  2.  
  3. void add(Listener listener, boolean upsert){ 
  4.     synchronized(listeners){ 
  5.         List results = new ArrayList(); 
  6.         for(Listener ler:listeners){ 
  7.         ... 
  8.         } 
  9.         listeners = results; 
  10.     } 

上面的代碼,由于在邏輯中,強行給鎖listeners對象進行了重新賦值,會造成鎖的錯亂或者失效。

為了保險起見,我們通常把鎖對象聲明成final類型的。

  1. final List listeners = new ArrayList(); 

或者直接聲明專用的鎖對象,定義成普通的Object對象即可。

  1. final Object listenersLock = new Object(); 

2.5. 處理循環(huán)中的異常

在異步線程里處理一些定時任務,或者執(zhí)行時間非常長的批量處理,是經(jīng)常遇到的需求。我就不止一次看到小伙伴們的程序執(zhí)行了一部分就停止的情況。

排查到這些中止的根本原因,就是其中的某行數(shù)據(jù)發(fā)生了問題,造成了整個線程的死亡。

我們還是來看一下代碼的模板。

  1. volatile boolean run = true
  2. void loop(){ 
  3.     while(run){ 
  4.      for(Task task: taskList){ 
  5.             //do . sth 
  6.             int a = 1/0; 
  7.      } 
  8.     } 

在loop函數(shù)中,執(zhí)行我們真正的業(yè)務邏輯。當執(zhí)行到某個task的時候,發(fā)生了異常。這個時候,線程并不會繼續(xù)運行下去,而是會拋出異常直接中止。在寫普通函數(shù)的時候,我們都知道程序的這種行為,但一旦到了多線程,很多同學都會忘了這一環(huán)。

值得注意的是,即使是非捕獲類型的NullPointerException,也會引起線程的中止。所以,時刻把要執(zhí)行的邏輯,放在try catch中,是個非常好的習慣。

  1. volatile boolean run = true
  2. void loop(){ 
  3.     while(run){ 
  4.      for(Task task: taskList){ 
  5.       try{ 
  6.                 //do . sth 
  7.                 int a = 1/0; 
  8.       }catch(Exception ex){ 
  9.        //log 
  10.       } 
  11.      } 
  12.     } 

2.6. HashMap正確用法

HashMap在多線程環(huán)境下,會產(chǎn)生死循環(huán)問題。這個問題已經(jīng)得到了廣泛的普及,因為它會產(chǎn)生非常嚴重的后果:CPU跑滿,代碼無法執(zhí)行,jstack查看時阻塞在get方法上。

至于怎么提高HashMap效率,什么時候轉(zhuǎn)紅黑樹轉(zhuǎn)列表,這是陽春白雪的八股界話題,我們下里巴人只關注怎么不出問題。

網(wǎng)絡上有詳細的文章描述死循環(huán)問題產(chǎn)生的場景,大體因為HashMap在進行rehash時,會形成環(huán)形鏈。某些get請求會走到這個環(huán)上。JDK并不認為這是個bug,雖然它的影響比較惡劣。

如果你判斷你的集合類會被多線程使用,那就可以使用線程安全的ConcurrentHashMap來替代它。

HashMap還有一個安全刪除的問題,和多線程關系不大,但它拋出的是ConcurrentModificationException,看起來像是多線程的問題。我們一塊來看看它。

  1. Map<String, String> map = new HashMap<>(); 
  2. map.put("xjjdog0""狗1"); 
  3. map.put("xjjdog1""狗2"); 
  4.   
  5. for (Map.Entry<String, String> entry : map.entrySet()) { 
  6.     String key = entry.getKey(); 
  7.     if ("xjjdog0".equals(key)) { 
  8.        map.remove(key); 
  9.     } 

上面的代碼會拋出異常,這是由于HashMap的Fail-Fast機制。如果我們想要安全的刪除某些元素,應該使用迭代器。

  1. Iterator<Map.Entry<String, String>> iterator = map.entrySet().iterator(); 
  2. while (iterator.hasNext()) { 
  3.    Map.Entry<String, String> entry = iterator.next(); 
  4.    String key = entry.getKey(); 
  5.    if ("xjjdog0".equals(key)) { 
  6.        iterator.remove(); 
  7.    } 

2.7. 線程安全的保護范圍

使用了線程安全的類,寫出來的代碼就一定是線程安全的么?答案是否定的。

線程安全的類,只負責它內(nèi)部的方法是線程安全的。如我我們在外面把它包了一層,那么它是否能達到線程安全的效果,就需要重新探討。

比如下面這種情況,我們使用了線程安全的ConcurrentHashMap來存儲計數(shù)。雖然ConcurrentHashMap本身是線程安全的,不會再出現(xiàn)死循環(huán)的問題。但addCounter函數(shù),明顯是不正確的,它需要使用synchronized函數(shù)包裹才行。

  1. private final ConcurrentHashMap<String,Integer> counter; 
  2. public int addCounter(String name) { 
  3.     Integer current = counter.get(name); 
  4.     int newValue = ++current
  5.     counter.put(name,newValue); 
  6.     return newValue; 

這是開發(fā)人員常踩的坑之一。要達到線程安全,需要看一下線程安全的作用范圍。如果更大維度的邏輯存在同步問題,那么即使使用了線程安全的集合,也達不到想要的效果。

2.8. volatile作用有限

volatile關鍵字,解決了變量的可見性問題,可以讓你的修改,立馬讓其他線程給讀到。

雖然這個東西在面試的時候問的挺多的,包括ConcurrentHashMap中隊volatile的那些優(yōu)化。但在平常的使用中,你真的可能只會接觸到boolean變量的值修改。

  1. volatile boolean closed;   
  2.    
  3. public void shutdown() {    
  4.     closed = true;    
  5. }   

千萬不要把它用在計數(shù)或者線程同步上,比如下面這樣。

  1. volatile count = 0; 
  2. void add(){ 
  3.     ++count

這段代碼在多線程環(huán)境下,是不準確的。這是因為volatile只保證可見性,不保證原子性,多線程操作并不能保證其正確性。

直接用Atomic類或者同步關鍵字多好,你真的在乎這納秒級別的差異么?

2.9. 日期處理要小心

很多時候,日期處理也會出問題。這是因為使用了全局的Calendar,SimpleDateFormat等。當多個線程同時執(zhí)行format函數(shù)的時候,就會出現(xiàn)數(shù)據(jù)錯亂。

  1. SimpleDateFormat format = new SimpleDateFormat("yyyy-MM-dd hh:mm:ss"); 
  2.  
  3. Date getDate(String str){ 
  4.     return format(str); 

為了改進,我們通常將SimpleDateFormat放在ThreadLocal中,每個線程一份拷貝,這樣可以避免一些問題。當然,現(xiàn)在我們可以使用線程安全的DateTimeFormatter了。

  1. static DateTimeFormatter FOMATTER = DateTimeFormatter.ofPattern("MM/dd/yyyy HH:mm:ss"); 
  2. public static void main(String[] args) { 
  3.     ZonedDateTime zdt = ZonedDateTime.now(); 
  4.     System.out.println(FOMATTER.format(zdt)); 

2.10. 不要在構造函數(shù)中啟動線程

在構造函數(shù),或者static代碼塊中啟動新的線程,并沒有什么錯誤。但是,強烈不推薦你這么做。

因為Java是有繼承的,如果你在構造函數(shù)中做了這種事,那么子類的行為將變得非常魔幻。另外,this對象可能在構造完畢之前,出遞到另外一個地方被使用,造成一些不可預料的行為。

所以把線程的啟動,放在一個普通方法,比如start中,是更好的選擇。它可以減少bug發(fā)生的機率。

End

wait和notify是非常容易出問題的地方,

編碼格式要求非常嚴格。synchronized關鍵字相對來說比較簡單,但同步代碼塊的時候依然有許多要注意的點。這些經(jīng)驗,在concurrent包所提供的各種API中依然實用。我們還要處理多線程邏輯中遇到的各種異常問題,避免中斷,避免死鎖。規(guī)避了這些坑,基本上多線程代碼寫起來就算是入門了。

許多java開發(fā),都是剛剛接觸多線程開發(fā),在平常的工作中應用也不是很多。如果你做的是crud的業(yè)務系統(tǒng),那么寫一些多線程代碼的時候就更少了。但總有例外,你的程序變得很慢,或者排查某個問題,你會直接參與到多線程的編碼中來。

我們的各種工具軟件,也在大量使用多線程。從Tomcat,到各種中間件,再到各種數(shù)據(jù)庫連接池緩存等,每個地方都充斥著多線程的代碼。

即使是有經(jīng)驗的開發(fā),也會陷入很多多線程的陷阱。因為異步會造成時序的混亂,必須要通過強制的手段達到數(shù)據(jù)的同步。多線程運行,首先要保證準確性,使用線程安全的集合進行數(shù)據(jù)存儲;還要保證效率,畢竟使用多線程的目標就是如此。

希望本文中的這些實際案例,讓你對多線程的理解,更上一層樓。 

小姐姐味道 (xjjdog),一個不允許程序員走彎路的公眾號。聚焦基礎架構和Linux。十年架構,日百億流量,與你探討高并發(fā)世界,給你不一樣的味道。

責任編輯:武曉燕 來源: 小姐姐味道
相關推薦

2023-06-05 07:56:10

線程分配處理器

2017-03-27 20:42:17

遷移學習人工智能機器學習

2020-03-05 09:53:59

ElasticSearLuceneJava

2024-03-28 12:51:00

Spring異步多線程

2017-02-20 14:12:49

自然語言處理研究

2020-12-16 10:00:59

Serverless數(shù)字化云原生

2021-04-25 14:56:18

開發(fā)技能代碼

2017-03-30 17:54:28

深度神經(jīng)網(wǎng)絡人工智能 DNN

2019-12-25 14:35:33

分布式架構系統(tǒng)

2017-01-12 16:13:28

自然語言深度學習系統(tǒng)

2017-04-04 19:52:24

強化學習深度學習機器學習

2011-03-28 11:05:17

ODBC

2024-05-21 08:09:00

OpenTelemetry倉庫

2009-08-18 10:34:31

Java入門基本概念

2023-10-17 09:36:32

Spark大數(shù)據(jù)

2024-04-24 13:45:00

2024-04-03 12:30:00

C++開發(fā)

2021-02-26 00:46:11

CIO數(shù)據(jù)決策數(shù)字化轉(zhuǎn)型

2011-07-21 15:28:30

java

2016-01-14 09:30:46

Hive概念安裝使用
點贊
收藏

51CTO技術棧公眾號