深入Java核心 Java內(nèi)存分配原理精講
Java內(nèi)存分配與管理是Java的核心技術(shù)之一,之前我們曾介紹過Java的內(nèi)存管理與內(nèi)存泄露以及Java垃圾回收方面的知識,今天我們再次深入Java核心,詳細(xì)介紹一下Java在內(nèi)存分配方面的知識。一般Java在內(nèi)存分配時(shí)會涉及到以下區(qū)域:
◆寄存器:我們在程序中無法控制
◆棧:存放基本類型的數(shù)據(jù)和對象的引用,但對象本身不存放在棧中,而是存放在堆中
◆堆:存放用new產(chǎn)生的數(shù)據(jù)
◆靜態(tài)域:存放在對象中用static定義的靜態(tài)成員
◆常量池:存放常量
◆非RAM存儲:硬盤等永久存儲空間
Java內(nèi)存分配中的棧
在函數(shù)中定義的一些基本類型的變量數(shù)據(jù)和對象的引用變量都在函數(shù)的棧內(nèi)存中分配。
當(dāng)在一段代碼塊定義一個(gè)變量時(shí),Java就在棧中 為這個(gè)變量分配內(nèi)存空間,當(dāng)該變量退出該作用域后,Java會自動(dòng)釋放掉為該變量所分配的內(nèi)存空間,該內(nèi)存空間可以立即被另作他用。
Java內(nèi)存分配中的堆
堆內(nèi)存用來存放由new創(chuàng)建的對象和數(shù)組。 在堆中分配的內(nèi)存,由Java虛擬機(jī)的自動(dòng)垃圾回收器來管理。
在堆中產(chǎn)生了一個(gè)數(shù)組或?qū)ο蠛螅€可以 在棧中定義一個(gè)特殊的變量,讓棧中這個(gè)變量的取值等于數(shù)組或?qū)ο笤诙褍?nèi)存中的首地址,棧中的這個(gè)變量就成了數(shù)組或?qū)ο蟮囊米兞俊?nbsp; 引用變量就相當(dāng)于是 為數(shù)組或?qū)ο笃鸬囊粋€(gè)名稱,以后就可以在程序中使用棧中的引用變量來訪問堆中的數(shù)組或?qū)ο蟆R米兞烤拖喈?dāng)于是為數(shù)組或者對象起的一個(gè)名稱。
引用變量是普通的變量,定義時(shí)在棧中分配,引用變量在程序運(yùn)行到其作用域之外后被釋放。而數(shù)組和對象本身在堆中分配,即使程序 運(yùn)行到使用 new 產(chǎn)生數(shù)組或者對象的語句所在的代碼塊之外,數(shù)組和對象本身占據(jù)的內(nèi)存不會被釋放,數(shù)組和對象在沒有引用變量指向它的時(shí)候,才變?yōu)槔?,不能在被使用,但?然占據(jù)內(nèi)存空間不放,在隨后的一個(gè)不確定的時(shí)間被垃圾回收器收走(釋放掉)。這也是 Java 比較占內(nèi)存的原因。
實(shí)際上,棧中的變量指向堆內(nèi)存中的變量,這就是Java中的指針!
常量池 (constant pool)
常量池指的是在編譯期被確定,并被保存在已編譯的.class文件中的一些數(shù)據(jù)。除了包含代碼中所定義的各種基本類型(如int、long等等)和對象型(如String及數(shù)組)的常量值(final)還包含一些以文本形式出現(xiàn)的符號引用,比如:
◆類和接口的全限定名;
◆字段的名稱和描述符;
◆方法和名稱和描述符。
虛擬機(jī)必須為每個(gè)被裝載的類型維護(hù)一個(gè)常量池。常量池就是該類型所用到常量的一個(gè)有序集和,包括直接常量(string,integer和 floating point常量)和對其他類型,字段和方法的符號引用。
對于String常量,它的值是在常量池中的。而JVM中的常量池在內(nèi)存當(dāng)中是以表的形式存在的, 對于String類型,有一張固定長度的CONSTANT_String_info表用來存儲文字字符串值,注意:該表只存儲文字字符串值,不存儲符號引 用。說到這里,對常量池中的字符串值的存儲位置應(yīng)該有一個(gè)比較明了的理解了。
在程序執(zhí)行的時(shí)候,常量池 會儲存在Method Area,而不是堆中。
堆與棧
Java的堆是一個(gè)運(yùn)行時(shí)數(shù)據(jù)區(qū),類的(對象從中分配空間。這些對象通過new、newarray、 anewarray和multianewarray等指令建立,它們不需要程序代碼來顯式的釋放。堆是由垃圾回收來負(fù)責(zé)的,堆的優(yōu)勢是可以動(dòng)態(tài)地分配內(nèi)存 大小,生存期也不必事先告訴編譯器,因?yàn)樗窃谶\(yùn)行時(shí)動(dòng)態(tài)分配內(nèi)存的,Java的垃圾收集器會自動(dòng)收走這些不再使用的數(shù)據(jù)。但缺點(diǎn)是,由于要在運(yùn)行時(shí)動(dòng)態(tài) 分配內(nèi)存,存取速度較慢。
棧的優(yōu)勢是,存取速度比堆要快,僅次于寄存器,棧數(shù)據(jù)可以共享。但缺點(diǎn)是,存在棧中的數(shù)據(jù)大小與生存期必須是 確定的,缺乏靈活性。棧中主要存放一些基本類型的變量數(shù)據(jù)(int, short, long, byte, float, double, boolean, char)和對象句柄(引用)。
棧有一個(gè)很重要的特殊性,就是存在棧中的數(shù)據(jù)可以共享。假設(shè)我們同時(shí)定義:
- int a = 3;
- int b = 3;
編譯器先處理int a = 3;首先它會在棧中創(chuàng)建一個(gè)變量為a的引用,然后查找棧中是否有3這個(gè)值,如果沒找到,就將3存放進(jìn)來,然后將a指向3。接著處理int b = 3;在創(chuàng)建完b的引用變量后,因?yàn)樵跅V幸呀?jīng)有3這個(gè)值,便將b直接指向3。這樣,就出現(xiàn)了a與b同時(shí)均指向3的情況。
這時(shí),如果再令 a=4;那么編譯器會重新搜索棧中是否有4值,如果沒有,則將4存放進(jìn)來,并令a指向4;如果已經(jīng)有了,則直接將a指向這個(gè)地址。因此a值的改變不會影響 到b的值。
要注意這種數(shù)據(jù)的共享與兩個(gè)對象的引用同時(shí)指向一個(gè)對象的這種共享是不同的,因?yàn)檫@種情況a的修改并不會影響到b, 它是由編譯器完成的,它有利于節(jié)省空間。而一個(gè)對象引用變量修改了這個(gè)對象的內(nèi)部狀態(tài),會影響到另一個(gè)對象引用變量。#p#
String是一個(gè)特殊的包裝類數(shù)據(jù)??梢杂茫?/p>
- String str = new String("abc");
- String str = "abc";
兩種的形式來創(chuàng)建,第一種是用new()來新建對象的,它會在存放于堆中。每調(diào)用一次就會創(chuàng)建一個(gè)新的對象。而第二種是先在棧中創(chuàng)建一個(gè)對String類的對象引用變量str,然后通過符號引用去字符串常量池 里找有沒有"abc",如果沒有,則將"abc"存放進(jìn)字符串常量池 ,并令str指向”abc”,如果已經(jīng)有”abc” 則直接令str指向“abc”。
比較類里面的數(shù)值是否相等時(shí),用equals()方法;當(dāng)測試兩個(gè)包裝類的引用是否指向同一個(gè)對象時(shí),用==,下面用例子說明上面的理論。
- String str1 = "abc";
- String str2 = "abc";
- System.out.println(str1==str2); //true
可以看出str1和str2是指向同一個(gè)對象的。
- String str1 =new String ("abc");
- String str2 =new String ("abc");
- System.out.println(str1==str2); // false
用new的方式是生成不同的對象。每一次生成一個(gè)。
因此用第二種方式創(chuàng)建多個(gè)”abc”字符串,在內(nèi)存中 其實(shí)只存在一個(gè)對象而已. 這種寫法有利與節(jié)省內(nèi)存空間. 同時(shí)它可以在一定程度上提高程序的運(yùn)行速度,因?yàn)镴VM會自動(dòng)根據(jù)棧中數(shù)據(jù)的實(shí)際情況來決定是否有必要?jiǎng)?chuàng)建新對象。而對于String str = new String("abc");的代碼,則一概在堆中創(chuàng)建新對象,而不管其字符串值是否相等,是否有必要?jiǎng)?chuàng)建新對象,從而加重了程序的負(fù)擔(dān)。
另 一方面, 要注意: 我們在使用諸如String str = "abc";的格式定義類時(shí),總是想當(dāng)然地認(rèn)為,創(chuàng)建了String類的對象str。擔(dān)心陷阱!對象可能并沒有被創(chuàng)建!而可能只是指向一個(gè)先前已經(jīng)創(chuàng)建的 對象。只有通過new()方法才能保證每次都創(chuàng)建一個(gè)新的對象。
由于String類的immutable性質(zhì),當(dāng)String變量需要經(jīng)常變換 其值時(shí),應(yīng)該考慮使用StringBuffer類,以提高程序效率。
1. 首先String不屬于8種基本數(shù)據(jù)類型,String是一個(gè)對象。因?yàn)閷ο蟮哪J(rèn)值是null,所以String的默認(rèn)值也是null;但它又是一種特殊的對象,有其它對象沒有的一些特性。
2. new String()和new String(”")都是申明一個(gè)新的空字符串,是空串不是null;
3. String str=”kvill”;String str=new String (”kvill”)的區(qū)別
示例:
- String s0="kvill";
- String s1="kvill";
- String s2="kv" + "ill";
- System.out.println( s0==s1 );
- System.out.println( s0==s2 );
結(jié)果為:
true
true
首先,我們要知結(jié)果為道Java 會確保一個(gè)字符串常量只有一個(gè)拷貝。
因?yàn)槔又械?s0和s1中的”kvill”都是字符串常量,它們在編譯期就被確定了,所以s0==s1為true;而”kv”和”ill”也都是字符串常量,當(dāng)一個(gè)字 符串由多個(gè)字符串常量連接而成時(shí),它自己肯定也是字符串常量,所以s2也同樣在編譯期就被解析為一個(gè)字符串常量,所以s2也是常量池中” kvill”的一個(gè)引用。所以我們得出s0==s1==s2;用new String() 創(chuàng)建的字符串不是常量,不能在編譯期就確定,所以new String() 創(chuàng)建的字符串不放入常量池中,它們有自己的地址空間。
示例:
- String s0="kvill";
- String s1=new String("kvill");
- String s2="kv" + new String("ill");
- System.out.println( s0==s1 );
- System.out.println( s0==s2 );
- System.out.println( s1==s2 );
結(jié)果為:
false
false
false
例2中s0還是常量池 中"kvill”的應(yīng)用,s1因?yàn)闊o法在編譯期確定,所以是運(yùn)行時(shí)創(chuàng)建的新對象”kvill”的引用,s2因?yàn)橛泻蟀氩糠?new String(”ill”)所以也無法在編譯期確定,所以也是一個(gè)新創(chuàng)建對象”kvill”的應(yīng)用;明白了這些也就知道為何得出此結(jié)果了。
4. String.intern():
再補(bǔ)充介紹一點(diǎn):存在于.class文件中的常量池,在運(yùn)行期被JVM裝載,并且可以擴(kuò)充。String的 intern()方法就是擴(kuò)充常量池的 一個(gè)方法;當(dāng)一個(gè)String實(shí)例str調(diào)用intern()方法時(shí),Java 查找常量池中 是否有相同Unicode的字符串常量,如果有,則返回其的引用,如果沒有,則在常 量池中增加一個(gè)Unicode等于str的字符串并返回它的引用;看示例就清楚了
示例:
- String s0= "kvill";
- String s1=new String("kvill");
- String s2=new String("kvill");
- System.out.println( s0==s1 );
- System.out.println( "**********" );
- s1.intern();
- s2=s2.intern(); //把常量池中"kvill"的引用賦給s2
- System.out.println( s0==s1);
- System.out.println( s0==s1.intern() );
- System.out.println( s0==s2 );
結(jié)果為:
false
false //雖然執(zhí)行了s1.intern(),但它的返回值沒有賦給s1
true //說明s1.intern()返回的是常量池中"kvill"的引用
true
最后我再破除一個(gè)錯(cuò)誤的理解:有人說,“使用 String.intern() 方法則可以將一個(gè) String 類的保存到一個(gè)全局 String 表中 ,如果具有相同值的 Unicode 字符串已經(jīng)在這個(gè)表中,那么該方法返回表中已有字符串的地址,如果在表中沒有相同值的字符串,則將自己的地址注冊到表中”如果我把他說的這個(gè)全局的 String 表理解為常量池的話,他的最后一句話,”如果在表中沒有相同值的字符串,則將自己的地址注冊到表中”是錯(cuò)的:
示例:
- String s1=new String("kvill");
- String s2=s1.intern();
- System.out.println( s1==s1.intern() );
- System.out.println( s1+" "+s2 );
- System.out.println( s2==s1.intern() );
結(jié)果:
false
kvill kvill
true
在這個(gè)類中我們沒有聲名一個(gè)”kvill”常量,所以常量池中一開始是沒有”kvill”的,當(dāng)我們調(diào)用s1.intern()后就在常量池中新添加了一 個(gè)”kvill”常量,原來的不在常量池中的”kvill”仍然存在,也就不是“將自己的地址注冊到常量池中”了。
s1==s1.intern() 為false說明原來的”kvill”仍然存在;s2現(xiàn)在為常量池中”kvill”的地址,所以有s2==s1.intern()為true。
5. 關(guān)于equals()和==:
這個(gè)對于String簡單來說就是比較兩字符串的Unicode序列是否相當(dāng),如果相等返回true;而==是 比較兩字符串的地址是否相同,也就是是否是同一個(gè)字符串的引用。
6. 關(guān)于String是不可變的
這一說又要說很多,大家只 要知道String的實(shí)例一旦生成就不會再改變了,比如說:String str=”kv”+”ill”+” “+”ans”; 就是有4個(gè)字符串常量,首先”kv”和”ill”生成了”kvill”存在內(nèi)存中,然后”kvill”又和” ” 生成 “kvill “存在內(nèi)存中,最后又和生成了”kvill ans”;并把這個(gè)字符串的地址賦給了str,就是因?yàn)镾tring的”不可變”產(chǎn)生了很多臨時(shí)變量,這也就是為什么建議用StringBuffer的原 因了,因?yàn)镾tringBuffer是可改變的。
下面是一些String相關(guān)的常見問題:
String中的final用法和理解
final StringBuffer a = new StringBuffer("111");
final StringBuffer b = new StringBuffer("222");
a=b;//此句編譯不通過
final StringBuffer a = new StringBuffer("111");
a.append("222");// 編譯通過
可見,final只對引用的"值"(即內(nèi)存地址)有效,它迫使引用只能指向初始指向的那個(gè)對象,改變它的指向會導(dǎo)致編譯期錯(cuò)誤。至于它所指向的對象 的變化,final是不負(fù)責(zé)的。#p#
String常量池問題的幾個(gè)例子
下面是幾個(gè)常見例子的比較分析和理解:
- String a = "a1";
- String b = "a" + 1;
- System.out.println((a == b)); //result = true
- String a = "atrue";
- String b = "a" + "true";
- System.out.println((a == b)); //result = true
- String a = "a3.4";
- String b = "a" + 3.4;
- System.out.println((a == b)); //result = true
分析:JVM對于字符串常量的"+"號連接,將程序編譯期,JVM就將常量字符串的"+"連接優(yōu)化為連接后的值,拿"a" + 1來說,經(jīng)編譯器優(yōu)化后在class中就已經(jīng)是a1。在編譯期其字符串常量的值就確定下來,故上面程序最終的結(jié)果都為true。
- String a = "ab";
- String bb = "b";
- String b = "a" + bb;
- System.out.println((a == b)); //result = false
分析:JVM對于字符串引用,由于在字符串的"+"連接中,有字符串引用存在,而引用的值在程序編譯期是無法確定的,即"a" + bb無法被編譯器優(yōu)化,只有在程序運(yùn)行期來動(dòng)態(tài)分配并將連接后的新地址賦給b。所以上面程序的結(jié)果也就為false。
- String a = "ab";
- final String bb = "b";
- String b = "a" + bb;
- System.out.println((a == b)); //result = true
分析:和[3]中唯一不同的是bb字符串加了final修飾,對于final修飾的變量,它在編譯時(shí)被解析為常量值的一個(gè)本地拷貝存儲到自己的常量 池中或嵌入到它的字節(jié)碼流中。所以此時(shí)的"a" + bb和"a" + "b"效果是一樣的。故上面程序的結(jié)果為true。
- String a = "ab";
- final String bb = getBB();
- String b = "a" + bb;
- System.out.println((a == b)); //result = false
- private static String getBB() {
- return "b";
- }
分析:JVM對于字符串引用bb,它的值在編譯期無法確定,只有在程序運(yùn)行期調(diào)用方法后,將方法的返回值和"a"來動(dòng)態(tài)連接并分配地址為b,故上面 程序的結(jié)果為false。
通過上面4個(gè)例子可以得出得知:
String s = "a" + "b" + "c";
就等價(jià)于String s = "abc";
String a = "a";
String b = "b";
String c = "c";
String s = a + b + c;
這個(gè)就不一樣了,最終結(jié)果等于:
- StringBuffer temp = new StringBuffer();
- temp.append(a).append(b).append(c);
- String s = temp.toString();
由上面的分析結(jié)果,可就不難推斷出String 采用連接運(yùn)算符(+)效率低下原因分析,形如這樣的代碼:
- public class Test {
- public static void main(String args[]) {
- String s = null;
- for(int i = 0; i < 100; i++) {
- s += "a";
- }
- }
- }
每做一次 + 就產(chǎn)生個(gè)StringBuilder對象,然后append后就扔掉。下次循環(huán)再到達(dá)時(shí)重新產(chǎn)生個(gè)StringBuilder對象,然后 append 字符串,如此循環(huán)直至結(jié)束。如果我們直接采用 StringBuilder 對象進(jìn)行 append 的話,我們可以節(jié)省 N - 1 次創(chuàng)建和銷毀對象的時(shí)間。所以對于在循環(huán)中要進(jìn)行字符串連接的應(yīng)用,一般都是用StringBuffer或StringBulider對象來進(jìn)行 append操作。
String對象的intern方法理解和分析:
- public class Test4 {
- private static String a = "ab";
- public static void main(String[] args){
- String s1 = "a";
- String s2 = "b";
- String s = s1 + s2;
- System.out.println(s == a);//false
- System.out.println(s.intern() == a);//true
- }
- }
這里用到Java里面是一個(gè)常量池的問題。對于s1+s2操作,其實(shí)是在堆里面重新創(chuàng)建了一個(gè)新的對象,s保存的是這個(gè)新對象在堆空間的的內(nèi)容,所 以s與a的值是不相等的。而當(dāng)調(diào)用s.intern()方法,卻可以返回s在常量池中的地址值,因?yàn)閍的值存儲在常量池中,故s.intern和a的值相等。
總結(jié)
棧中用來存放一些原始數(shù)據(jù)類型的局部變量數(shù)據(jù)和對象的引用(String,數(shù)組.對象等等)但不存放對象內(nèi)容
堆中存放使用new關(guān)鍵字創(chuàng)建的對象.
字符串是一個(gè)特殊包裝類,其引用是存放在棧里的,而對象內(nèi)容必須根據(jù)創(chuàng)建方式不同定(常量池和堆).有的是編譯期就已經(jīng)創(chuàng)建好,存放在字符串常 量池中,而有的是運(yùn)行時(shí)才被創(chuàng)建.使用new關(guān)鍵字,存放在堆中。
【編輯推薦】
- 深入Java底層:內(nèi)存屏障與JVM并發(fā)詳解
- 20個(gè)開發(fā)人員非常有用的Java功能代碼
- Java內(nèi)存溢出的詳細(xì)解決方案
- 深入理解Java多態(tài)性
- Java虛擬機(jī)內(nèi)部構(gòu)成淺析