深入理解 Java String#intern() 內(nèi)存模型
字符串常量池是一個固定大小的HashMap,桶的數(shù)量默認是1009, 從Java7u40開始,該默認值增大到60013。在Java6當(dāng)中,字符串常量池是放在Perm空間的,從Java7開始,字符串常量池被移到Heap空間。下面,我們通過測試程序來窺探字符串常量池在Java6,Java7兩個不同版本底下的內(nèi)存分配情況。
測試程序
- public class StringPoolTest {
- public void testStringPoolWithLongString(){
- long i=0;
- while(true){
- String longString = "This is a very long string, very very long string to test the gc behavior of the string constant pool"+i;
- longString.intern();
- i++;
- }
- }
- public static void main(String[] args){
- StringPoolTest stringPoolTest = new StringPoolTest();
- stringPoolTest.testStringPoolWithLongString();
- }
- }
測試程序很簡單,一個死循環(huán),循環(huán)里面通過遞增變量i制造唯一的字符串,然后用main函數(shù)啟動程序。
Java 6
我們使用版本Jdk1.6.0_29來跑該程序,打開Java VisualVM監(jiān)控,可以看到,Perm區(qū)不斷發(fā)生GC,由此的出結(jié)論,雖然字符串常量池放在Perm空間,但當(dāng)Perm空間接近滿的時候,JVM會將字符串常量池中的無用字符串回收掉。

Java 7
下面,我們切換到Jdk1.7.0_67重跑該程序,可以看到Perm區(qū)內(nèi)存分配曲線很平滑,沒有出現(xiàn)內(nèi)存分配的現(xiàn)象。
但在Heap空間,新的對象不斷產(chǎn)生,然后不斷觸發(fā)GC
結(jié)論
由于Perm區(qū)大小是有限的,通常只有幾十MB,所以不推薦在Java6下廣泛使用String.intern(),這篇文章string-intern-in-java-6-7-8的性能測試表明,在Java6底下大量使用intern()會導(dǎo)致應(yīng)用性能的顯著下降,還有可能產(chǎn)生OOM錯誤。但從Java7開始,字符串常量池被移到了Heap空間,Heap空間的大小只受制于機器的真實內(nèi)存大小,因此,在Java7下使用String.intern()能更有效地減少重復(fù)String對象對內(nèi)存的占用。