阿里二面:ThreadLocal內(nèi)存泄露靈魂四問,人麻了!
ThreadLocal能夠在線程本地存儲對應(yīng)的變量,從而有效的避免線程安全問題。但是使用ThreadLocal時,稍微不注意就有可能造成內(nèi)存泄露的問題。那么ThreadLocal在哪些場景下會出現(xiàn)內(nèi)存泄露?哪些場景下不會出現(xiàn)內(nèi)存泄露?出現(xiàn)內(nèi)存泄露的根本原因又是什么呢?如何真正避免內(nèi)存泄露?
這可能是你職業(yè)生涯中最具含金量的一次點擊,點擊【項目實戰(zhàn)】查看詳情,與冰河一起研發(fā)基于大廠真正核心技術(shù)的硬核項目。
接下來,我們就用大量的圖解來分析ThreadLocal內(nèi)存泄露的四個核心問題:哪些場景不會內(nèi)存泄露、哪些場景會內(nèi)存泄露、內(nèi)存泄露的根本原因是什么、以及如何真正 避免內(nèi)存泄露。
一、ThreadLocal內(nèi)部結(jié)構(gòu)
為了更好的說明ThreadLocal內(nèi)存泄露的場景,以及具體的原因,先來了解下ThreadLocal的內(nèi)部結(jié)構(gòu),如圖1所示。
圖片
可以看到,ThreadLocal對象是存儲在每個Thread線程內(nèi)部的ThreadLocalMap中的,并且在ThreadLocalMap中有一個Entry數(shù)組,Entry數(shù)組中的每一個元素都是一個Entry對象。
每個Entry對象中存儲著一個ThreadLocal對象與其對應(yīng)的value值,每個Entry對象在Entry數(shù)組中的位置是通過ThreadLocal對象的threadLocalHashCode計算出來的,以此來快速定位Entry對象在Entry數(shù)組中的位置。所以,在Thread中,可以存儲多個ThreadLocal對象。
二、不會出現(xiàn)內(nèi)存泄露的場景
了解完ThreadLocal的內(nèi)部存儲結(jié)構(gòu)后,我們先來思考下哪些場景下ThreadLocal不會發(fā)生內(nèi)存泄露,假設(shè)我們單獨開啟一個線程,并且將變量存儲到ThreadLocal中,如圖2所示。
圖片
可以看到,Thread線程在正常執(zhí)行的情況下,會引用ThreadLocalMap的實例對象,只要Thread線程一直在執(zhí)行任務(wù),這種引用關(guān)系就一直存在。
當(dāng)Thread線程執(zhí)行任務(wù)結(jié)束退出時,Thread線程與ThreadLocalMap實例對象之間的引用關(guān)系就不存在了,如圖3所示。
圖片
Thread線程執(zhí)行完任務(wù)退出后,線程里持有的ThreadLocalMap對象也就失去了強(qiáng)引用,此時ThreadLocalMap對象就會被GC自動回收,而ThreadLocalMap中包含的ThreadLocal對象也會被GC回收掉,如圖4所示。
圖片
可以看出,如果只是通過Thread類或者Thread類的子類來創(chuàng)建線程執(zhí)行任務(wù),隨著對應(yīng)線程的任務(wù)執(zhí)行完畢,線程退出,Thread線程引用的ThreadLocal也會被GC回收掉,此時就不會出現(xiàn)內(nèi)存泄露的問題。
三、會出現(xiàn)內(nèi)存泄露的場景
在實際項目中,如果為每個任務(wù)的執(zhí)行都開啟一個線程的話,是非常耗費系統(tǒng)資源的,所以,在實際項目中,我們很少直接使用Thread類來創(chuàng)建線程,而是使用線程池來執(zhí)行對應(yīng)的任務(wù)。如果是在線程池場景下,線程與ThreadLocalMap之間的引用關(guān)系又是怎樣的呢?
這里,我們先來看一張圖,如圖5所示。
圖片
可以看到,線程池中會有多個線程執(zhí)行任務(wù),如果是通過ThreadLocal存儲數(shù)據(jù)的話,每個線程都會引用一個ThreadLocalMap對象。
另外,線程池中的核心線程在執(zhí)行完任務(wù)后,是不會退出的,可以循環(huán)使用,說明線程池中的每個核心線程和ThreadLocalMap之間一直是強(qiáng)引用關(guān)系,核心線程對應(yīng)的ThreadLocal是不會自動被GC回收的,會存在內(nèi)存泄露的風(fēng)險。
四、內(nèi)存泄露問題分析
這里,我們對在線程池中使用ThreadLocal存在內(nèi)存泄露問題的原因進(jìn)行分析,首先,將ThreadLocalMap中的Entry數(shù)組展開,如圖6所示。
圖片
可以看到,ThreadLocalMap中包含一個Entry數(shù)組,而Entry數(shù)組中的每一個元素就是Entry對象,Entry對象中存儲的Key就是ThreadLocal對象,而value就是要存儲的數(shù)據(jù)。其中,Entry對象中的Key屬于弱引用,這點我們可以從ThreadLocalMap類中的內(nèi)部類Entry的定義可以看出。Entry類的源碼詳見:java.lang.ThreadLocal.ThreadLocalMap.Entry。
static class Entry extends WeakReference<ThreadLocal<?>> {
/** The value associated with this ThreadLocal. */
Object value;
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
}
可以看到,Entry類繼承了WeakReference類,WeakReference類的泛型是ThreadLocal,,說明ThreadLocalMap中的Entry數(shù)組對Entry對象的Key就是弱引用。所以,Entry對象中的Key可以被GC自動回收。當(dāng)Entry對象中的Key被GC自動回收后如圖7所示。
圖片
當(dāng)Entry對象中的Key被GC自動回收后,對應(yīng)的ThreadLocal被GC回收掉了,變成了null,但是ThreadLocal對應(yīng)的value值依然被Entry引用,不能被GC自動回收,如圖8所示。
圖片
此時,我們可以看到,Entry對象中的Key,也就是ThreadLocal對象可以被GC自動回收,但是對應(yīng)的value還在被引用,所以,value是不能被GC自動回收的,這種情況下就會存在內(nèi)存泄露的風(fēng)險。
我們再來總結(jié)下,在線程池中使用ThreadLocal保存數(shù)據(jù)存在內(nèi)存泄露風(fēng)險的原因:線程池中的核心線程會被循環(huán)使用,每個線程中對應(yīng)的ThreadLocalMap會被線程強(qiáng)引用。
所以,每個線程對應(yīng)的ThreadLocalMap不能被GC自動回收。而ThreadLocalMap中包含一個Entry數(shù)組,Entry數(shù)組中含有多個Key為ThreadLocal,value為存儲的數(shù)據(jù)的Entry對象,雖然Entry對象中的Key是弱引用,能夠被GC自動回收,但是value卻是強(qiáng)引用,不能被GC自動回收,所以,在線程池中使用ThreadLocal會存在內(nèi)存泄露的風(fēng)險。
五、如何避免內(nèi)存泄露
在線程池中使用ThreadLocal如何避免內(nèi)存泄露呢?ThreadLocal提供相應(yīng)的解決方法了嗎?這里,我們就從ThreadLocal的源碼中看看ThreadLocal是否提供了對應(yīng)的解決方案。
在ThreadLocal中,提供了一個remove()方法,源碼詳見:java.lang.ThreadLocal#remove。
public void remove() {
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null)
m.remove(this);
}
可以看到,在remove()方法中,首先根據(jù)當(dāng)前線程獲取ThreadLocalMap類型的m對象,不為空,則直接調(diào)用m對象的有參remove()方法移除value的值。
有參remove()方法的源碼詳見:java.lang.ThreadLocal.ThreadLocalMap#remove。
private void remove(ThreadLocal<?> key) {
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
if (e.get() == key) {
e.clear();
expungeStaleEntry(i);
return;
}
}
}
可以看到,在有參remove()方法中,會通過threadLocalHashCode計算出Entry對象在Entry數(shù)組中的位置,并獲取出對應(yīng)的Entry對象,如果Entry對象不為空,并且Entry對象中的Key等于傳入的ThreadLocal對象,則清除對應(yīng)的Key,并且調(diào)用expungeStaleEntry()方法。
接下來,我們再分析下expungeStaleEntry()方法,源碼詳見:java.lang.ThreadLocal.ThreadLocalMap#expungeStaleEntry。
private int expungeStaleEntry(int staleSlot) {
Entry[] tab = table;
int len = tab.length;
// expunge entry at staleSlot
tab[staleSlot].value = null;
tab[staleSlot] = null;
size--;
// Rehash until we encounter null
Entry e;
int i;
for (i = nextIndex(staleSlot, len);
(e = tab[i]) != null;
i = nextIndex(i, len)) {
ThreadLocal<?> k = e.get();
if (k == null) {
e.value = null;
tab[i] = null;
size--;
} else {
int h = k.threadLocalHashCode & (len - 1);
if (h != i) {
tab[i] = null;
// Unlike Knuth 6.4 Algorithm R, we must scan until
// null because multiple entries could have been stale.
while (tab[h] != null)
h = nextIndex(h, len);
tab[h] = e;
}
}
}
return i;
}
可以看到,在expungeStaleEntry()方法中,會將ThreadLocal為null對應(yīng)的value設(shè)置為null,同時會把對應(yīng)的Entry對象也設(shè)置為null,并且會將所有ThreadLocal對應(yīng)的value為null的Entry對象設(shè)置為null,這樣就去除了強(qiáng)引用,便于后續(xù)的GC進(jìn)行自動垃圾回收,也就避免了內(nèi)存泄露的問題。調(diào)用ThreadLocal的remove()方法后的示意圖如圖9所示。
圖片
注意:在ThreadLocal中,不僅僅是remove()方法會調(diào)用expungeStaleEntry()方法,在set()方法和get()方法中也可能會調(diào)用expungeStaleEntry()方法來清理數(shù)據(jù)。
還有一點需要注意的是,ThreadLocal雖然提供了避免內(nèi)存泄露的方法,但是ThreadLocal不會主動去執(zhí)行這些方法,需要我們在使用完ThreadLocal對象中保存的數(shù)據(jù)后,在finally{}代碼塊中調(diào)用ThreadLocal的remove()方法,加快GC自動垃圾回收,避免內(nèi)存泄露。
六、總結(jié)
本文,主要結(jié)合圖例介紹了ThreadLocal有關(guān)內(nèi)存泄露方面的知識,包括:ThreadLocal的內(nèi)部結(jié)構(gòu),不會出現(xiàn)內(nèi)存泄露的場景,會出現(xiàn)內(nèi)存泄露的場景,內(nèi)存泄露的問題分析以及如何避免內(nèi)存泄露。