自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Java中的substring真的會引起內(nèi)存泄露么?

開發(fā) 后端
在Java中開發(fā),String是我們開發(fā)程序可以說必須要使用的類型,String有一個substring方法用來截取字符串,我們想必也常常使用。但是你知道么,關(guān)于Java 6中的substring是否會引起內(nèi)存泄露,在國外的論壇和社區(qū)有著一些討論,以至于Java官方已經(jīng)將其標(biāo)記成bug,并且為此Java 7 還重新進行了實現(xiàn)。

在Java中開發(fā),String是我們開發(fā)程序可以說必須要使用的類型,String有一個substring方法用來截取字符串,我們想必也常常使用。但是你知道么,關(guān)于Java 6中的substring是否會引起內(nèi)存泄露,在國外的論壇和社區(qū)有著一些討論,以至于Java官方已經(jīng)將其標(biāo)記成bug,并且為此Java 7 還重新進行了實現(xiàn)。讀到這里可能你的問題就來了,substring怎么會引起內(nèi)存泄露呢?那么我們就帶著問題,走進小黑屋,看看substring有沒有內(nèi)存泄露,又是怎么導(dǎo)致所謂的內(nèi)存泄露。

基本介紹

substring方法提供兩種重載,***種為只接受開始截取位置一個參數(shù)的方法。

  1. public String substring(int beginIndex) 

比如我們使用上面的方法,"unhappy".substring(2) 返回結(jié)果 "happy"

另一種重載就是接受一個開始截取位置和一個結(jié)束截取位置的參數(shù)的方法。

  1. public String substring(int beginIndex, int endIndex) 

使用這個方法,"smiles".substring(1, 5) 返回結(jié)果 "mile"

通過這個介紹我們基本了解了substring的作用,這樣便于我們理解下面的內(nèi)容。

準備工作

因為這個問題出現(xiàn)的情況在Java 6,如果你的Java版本號不是Java 6 需要調(diào)整一下。

終端調(diào)整(適用于Mac系統(tǒng))

查看java版本號

  1. 13:03 $ java -version 
  2. java version "1.8.0_25" 
  3. Java(TM) SE Runtime Environment (build 1.8.0_25-b17) 
  4. Java HotSpot(TM) 64-Bit Server VM (build 25.25-b02, mixed mode) 

切換到1.6

  1. export JAVA_HOME=$(/usr/libexec/java_home -v 1.6) 

Ubuntu使用alternatives --config java,F(xiàn)edora上面使用alternatives --config java。

如果你使用Eclipse,可以選擇工程,右擊,選擇Properties(屬性)— Java Compiler(Java編譯器)進行特殊指定。

問題重現(xiàn)

這里貼一下java官方bug里用到的重現(xiàn)問題的代碼。

  1. public class TestGC { 
  2.     private String largeString = new String(new byte[100000]); 
  3.   
  4.     String getString() { 
  5.         return this.largeString.substring(0,2); 
  6.     } 
  7.   
  8.     public static void main(String[] args) { 
  9.         java.util.ArrayList list = new java.util.ArrayList(); 
  10.         for (int i = 0; i < 1000000; i++) { 
  11.             TestGC gc = new TestGC(); 
  12.             list.add(gc.getString()); 
  13.         } 
  14.     } 

然而上面的代碼,只要使用Java 6 (Java 7和8 都不會拋出異常)運行一下就會報java.lang.OutOfMemoryError: Java heap space的異常,這說明沒有足夠的堆內(nèi)存供我們創(chuàng)建對象,JVM選擇了拋出異常操作。

于是有人會說,是因為你每個循環(huán)中創(chuàng)建了一個TestGC對象,雖然我們加入ArrayList只是兩個字符的字符串,但是這個對象中又存儲largeString這么大的對象,這樣必然會造成OOM的。

然而,其實你說的不對。比如我們看一下這樣的代碼,我們只修改getString方法。

  1. public class TestGC { 
  2.     private String largeString = new String(new byte[100000]); 
  3.   
  4.     String getString() { 
  5.         //return this.largeString.substring(0,2); 
  6.       return new String("ab"); 
  7.     } 
  8.   
  9.     public static void main(String[] args) { 
  10.         java.util.ArrayList list = new java.util.ArrayList(); 
  11.         for (int i = 0; i < 1000000; i++) { 
  12.             TestGC gc = new TestGC(); 
  13.             list.add(gc.getString()); 
  14.         } 
  15.   
  16.     } 

執(zhí)行上面的方法,并不會導(dǎo)致OOM異常,因為我們持有的時1000000個ab字符串對象,而TestGC對象(包括其中的largeString)會在java的垃圾回收中釋放掉。所以這里不會存在內(nèi)存溢出。

那么究竟是什么導(dǎo)致的內(nèi)存泄露呢?要研究這個問題,我們需要看一下方法的實現(xiàn),即可。

深入Java 6實現(xiàn)

在String類中存在這樣三個屬性

  • value 字符數(shù)組,存儲字符串實際的內(nèi)容
  • offset 該字符串在字符數(shù)組value中的起始位置
  • count 字符串包含的字符的長度

Java 6中substring的實現(xiàn)

  1. public String substring(int beginIndex, int endIndex) { 
  2.   if (beginIndex < 0) { 
  3.       throw new StringIndexOutOfBoundsException(beginIndex); 
  4.   } 
  5.   if (endIndex > count) { 
  6.       throw new StringIndexOutOfBoundsException(endIndex); 
  7.   } 
  8.   if (beginIndex > endIndex) { 
  9.       throw new StringIndexOutOfBoundsException(endIndex - beginIndex); 
  10.   } 
  11.   return ((beginIndex == 0) && (endIndex == count)) ? this : 
  12.       new String(offset + beginIndex, endIndex - beginIndex, value); 

上述方法調(diào)用的構(gòu)造方法

  1. //Package private constructor which shares value array for speed. 
  2. String(int offset, int count, char value[]) { 
  3.   this.value = value; 
  4.   this.offset = offset; 
  5.   this.count = count; 

當(dāng)我們讀完上述的代碼,我們應(yīng)該會豁然開朗,原來是這個樣子?。?/p>

當(dāng)我們調(diào)用字符串a(chǎn)的substring得到字符串b,其實這個操作,無非就是調(diào)整了一下b的offset和count,用到的內(nèi)容還是a之前的value字符數(shù)組,并沒有重新創(chuàng)建新的專屬于b的內(nèi)容字符數(shù)組。

舉個和上面重現(xiàn)代碼相關(guān)的例子,比如我們有一個1G的字符串a(chǎn),我們使用substring(0,2)得到了一個只有兩個字符的字符串b,如果b的生命周期要長于a或者手動設(shè)置a為null,當(dāng)垃圾回收進行后,a被回收掉,b沒有回收掉,那么這1G的內(nèi)存占用依舊存在,因為b持有這1G大小的字符數(shù)組的引用。

看到這里,大家應(yīng)該可以明白上面的代碼為什么出現(xiàn)內(nèi)存溢出了。

共享內(nèi)容字符數(shù)組

其實substring中生成的字符串與原字符串共享內(nèi)容數(shù)組是一個很棒的設(shè)計,這樣避免了每次進行substring重新進行字符數(shù)組復(fù)制。正如其文檔說明的,共享內(nèi)容字符數(shù)組為了就是速度。但是對于本例中的問題,共享內(nèi)容字符數(shù)組顯得有點蹩腳。

如何解決

對于之前比較不常見的1G字符串只截取2個字符的情況可以使用下面的代碼,這樣的話,就不會持有1G字符串的內(nèi)容數(shù)組引用了。

  1. String littleString = new String(largeString.substring(0,2)); 

下面的這個構(gòu)造方法,在源字符串內(nèi)容數(shù)組長度大于字符串長度時,進行數(shù)組復(fù)制,新的字符串會創(chuàng)建一個只包含源字符串內(nèi)容的字符數(shù)組。

  1. public String(String original) { 
  2.   int size = original.count; 
  3.   char[] originalValue = original.value; 
  4.   char[] v; 
  5.   if (originalValue.length > size) { 
  6.       // The array representing the String is bigger than the new 
  7.       // String itself.  Perhaps this constructor is being called 
  8.       // in order to trim the baggage, so make a copy of the array. 
  9.       int off = original.offset; 
  10.       v = Arrays.copyOfRange(originalValue, off, off+size); 
  11.   } else { 
  12.       // The array representing the String is the same 
  13.       // size as the String, so no point in making a copy. 
  14.       v = originalValue; 
  15.   } 
  16.   this.offset = 0
  17.   this.count = size; 
  18.   this.value = v; 

Java 7 實現(xiàn)

在Java 7 中substring的實現(xiàn)拋棄了之前的內(nèi)容字符數(shù)組共享的機制,對于子字符串(自身除外)采用了數(shù)組復(fù)制實現(xiàn)單個字符串持有自己的應(yīng)該擁有的內(nèi)容。

  1. public String substring(int beginIndex, int endIndex) { 
  2.     if (beginIndex < 0) { 
  3.       throw new StringIndexOutOfBoundsException(beginIndex); 
  4.     } 
  5.     if (endIndex > value.length) { 
  6.       throw new StringIndexOutOfBoundsException(endIndex); 
  7.     } 
  8.     int subLen = endIndex - beginIndex; 
  9.     if (subLen < 0) { 
  10.       throw new StringIndexOutOfBoundsException(subLen); 
  11.     } 
  12.     return ((beginIndex == 0) && (endIndex == value.length)) ? this 
  13.                 : new String(value, beginIndex, subLen); 

substring方法中調(diào)用的構(gòu)造方法,進行內(nèi)容字符數(shù)組復(fù)制。

  1. public String(char value[], int offset, int count) { 
  2.     if (offset < 0) { 
  3.           throw new StringIndexOutOfBoundsException(offset); 
  4.     } 
  5.     if (count < 0) { 
  6.       throw new StringIndexOutOfBoundsException(count); 
  7.     } 
  8.     // Note: offset or count might be near -1>>>1. 
  9.     if (offset > value.length - count) { 
  10.       throw new StringIndexOutOfBoundsException(offset + count); 
  11.     } 
  12.     this.value = Arrays.copyOfRange(value, offset, offset+count); 

真的是內(nèi)存泄露么

我們知道了substring某些情況下可能引起內(nèi)存問題,但是這個叫做內(nèi)存泄露么?

其實個人認為這個不應(yīng)該算為內(nèi)存泄露,使用substring生成的字符串b固然會持有原有字符串a(chǎn)的內(nèi)容數(shù)組引用,但是當(dāng)a和b都被回收之后,該字符數(shù)組的內(nèi)容也是可以被垃圾回收掉的。

哪個版本實現(xiàn)的好

關(guān)于Java 7 對substring做的修改,收到了褒貶不一的反饋。

個人更加傾向于Java 6的實現(xiàn),當(dāng)進行substring時,使用共享內(nèi)容字符數(shù)組,速度會更快,不用重新申請內(nèi)存。雖然有可能出現(xiàn)本文中的內(nèi)存性能問題,但也是有方法可以解決的。

Java 7的實現(xiàn)不需要程序員特殊操作避免了本文中問題,但是進行每次substring的操作性能總會比java 6 的實現(xiàn)要差一些。這種實現(xiàn)顯得有點“糟糕”。

問題的價值

雖然這個問題出現(xiàn)在Java 6并且Java 7中已經(jīng)修復(fù),但并不代表我們就不需要了解,況且Java 7的重新實現(xiàn)被噴的很厲害。

其實這個問題的價值,還是比較寶貴的,尤其是內(nèi)容字符數(shù)組共享這個優(yōu)化的實現(xiàn)。希望可以為大家以后的設(shè)計實現(xiàn)提供幫助和一些想法。

受影響的方法

trim和subSequence都存在調(diào)用substring的操作。Java 6和Java 7 substring實現(xiàn)的更改也間接影響到了這些方法。

參考資源

以下三篇文章寫得都比較不錯,但是都稍微有一些問題,我都已經(jīng)標(biāo)明出來,大家閱讀時,需要注意。

注意

上面的重現(xiàn)問題的代碼中

  1. String getString() { 
  2.   //return this.largeString.substring(0,2); 
  3.       return new String("ab"); 

這里***不要寫成下面這樣,因為在JVM中存在字符串常量池,”ab”不會重新創(chuàng)建新字符串,所有的變量都會引用一個對象,而使用new String()則每次重新創(chuàng)建對象。

  1. String getString() { 
  2.       return "ab"; 

關(guān)于字符串常量池,以后的文章會有介紹。

吐血推薦

如果你對本文這樣的內(nèi)容感興趣,可以閱讀以下Joshua Bloch大神寫得書,雖然有點貴,還是英文的。 Java Puzzlers

原文鏈接:http://droidyue.com/blog/2014/12/14/substring-memory-issue-in-java/

 

責(zé)任編輯:張偉 來源: 技術(shù)小黑屋
相關(guān)推薦

2015-01-14 13:50:58

AndroidHandler內(nèi)存泄露

2013-08-07 10:07:07

Handler內(nèi)存泄露

2016-08-16 13:30:49

LinuxCachetmpfs

2025-01-08 08:47:44

Node.js內(nèi)存泄露定時器

2015-12-07 09:39:27

Java內(nèi)存泄露

2011-08-26 13:09:25

2012-04-11 13:46:33

ibmdw

2013-08-07 10:16:43

Android內(nèi)存泄漏

2023-09-20 10:36:59

2009-06-16 11:11:07

Java內(nèi)存管理Java內(nèi)存泄漏

2015-05-14 15:38:40

javajava內(nèi)存泄露

2011-11-17 13:59:41

Java內(nèi)存管理內(nèi)存泄露

2015-03-18 14:12:50

2018-02-06 08:15:07

2009-08-19 11:33:40

goto

2010-09-25 11:32:24

Java內(nèi)存泄漏

2010-09-25 11:23:15

Java內(nèi)存泄露

2019-08-27 08:24:17

簡歷技能工作

2013-12-23 09:25:21

2023-03-03 12:37:50

JavaJVM內(nèi)存溢出
點贊
收藏

51CTO技術(shù)棧公眾號