String 的不可變真的是因?yàn)?Final 嗎?
本文轉(zhuǎn)載自微信公眾號(hào)「飛天小牛肉」,作者飛天小牛肉。轉(zhuǎn)載本文請(qǐng)聯(lián)系飛天小牛肉公眾號(hào)。
String 為啥不可變?因?yàn)?String 中的 char 數(shù)組被 final 修飾。這套回答相信各位已經(jīng)背爛了,But 這并不正確!
- 面試官:講講 String、StringBuilder、StringBuffer 的區(qū)別
- 我:String 不可變,而 StringBuilder 和 StringBuffer 可變,叭叭叭 ......
- 面試官:String 為什么不可變?
- 我:String 被 final 修飾,這說明 String 不可繼承;并且String 中真正存儲(chǔ)字符的地方是 char 數(shù)組,這個(gè)數(shù)組被 final 修飾,所以 String 不可變
- 面試官:String 的不可變真的是因?yàn)?final 嗎?
- 我:是.....是的吧
- 面試官:OK,你這邊還有什么問題嗎?
- 我:卒......
什么是不可變?
《Effective Java》中對(duì)于不可變對(duì)象(Immutable Object)的定義是:對(duì)象一旦被創(chuàng)建后,對(duì)象所有的狀態(tài)及屬性在其生命周期內(nèi)不會(huì)發(fā)生任何變化。這就意味著,一旦我們將一個(gè)對(duì)象分配給一個(gè)變量,就無法再通過任何方式更改對(duì)象的狀態(tài)了。
String 不可變的表現(xiàn)就是當(dāng)我們?cè)噲D對(duì)一個(gè)已有的對(duì)象 "abcd" 賦值為 "abcde",String 會(huì)新創(chuàng)建一個(gè)對(duì)象:
String 為什么不可變?
String 用 final 修飾 char 數(shù)組,這個(gè)數(shù)組無法被修改,這么說確實(shí)沒啥問題。
但是!!!這個(gè)無法被修改僅僅是指引用地址不可被修改(也就是說棧里面的這個(gè)叫 value 的引用地址不可變,編譯器不允許我們把 value 指向堆中的另一個(gè)地址),并不代表存儲(chǔ)在堆中的這個(gè)數(shù)組本身的內(nèi)容不可變。舉個(gè)例子:
如果我們直接修改數(shù)組中的元素,是完全 OK 的:
那既然我們說 String 是不可變的,那顯然僅僅靠 final 是遠(yuǎn)遠(yuǎn)不夠的:
1)首先,char 數(shù)組是 private 的,并且 String 類沒有對(duì)外提供修改這個(gè)數(shù)組的方法,所以它初始化之后外界沒有有效的手段去改變它;
2)其次,String 類被 final 修飾的,也就是不可繼承,避免被他人繼承后破壞;
3)最重要的!是因?yàn)?Java 作者在 String 的所有方法里面,都很小心地避免去修改了 char 數(shù)組中的數(shù)據(jù),涉及到對(duì) char 數(shù)組中數(shù)據(jù)進(jìn)行修改的操作全部都會(huì)重新創(chuàng)建一個(gè) String 對(duì)象。你可以隨便翻個(gè)源碼看看來驗(yàn)證這個(gè)說法,比如 substring 方法:
為什么要設(shè)計(jì)成不可變的呢?
1)首先,字符串常量池的需要。
我們來回顧一下字符串常量池的定義:大量頻繁的創(chuàng)建字符串,將會(huì)極大程度的影響程序的性能。為此,JVM 為了提高性能和減少內(nèi)存開銷,在實(shí)例化字符串常量的時(shí)候進(jìn)行了一些優(yōu)化:
- 為字符串開辟了一個(gè)字符串常量池 String Pool,可以理解為緩存區(qū)
- 創(chuàng)建字符串常量時(shí),首先檢查字符串常量池中是否存在該字符串
- 若字符串常量池中存在該字符串,則直接返回該引用實(shí)例,無需重新實(shí)例化;若不存在,則實(shí)例化該字符串并放入池中。
如下面的代碼所示,堆內(nèi)存中只會(huì)創(chuàng)建一個(gè) String 對(duì)象:
- String str1 = "hello";
- String str2 = "hello";
- System.out.println(str1 == str2) // true
假設(shè) String 允許被改變,那如果我們修改了 str2 的內(nèi)容為 good,那么 str1 也會(huì)被修改,顯然這不是我們想要看見的結(jié)果。
2)另外一點(diǎn)也比較容易想到,String 被設(shè)計(jì)成不可變就是為了安全。
作為最基礎(chǔ)最常用的數(shù)據(jù)類型,String 被許多 Java 類庫用來作為參數(shù),如果 String 不是固定不變的,將會(huì)引起各種安全隱患。
舉個(gè)例子,我們來看看將可變的字符串 StringBuilder 存入 HashSet 的場(chǎng)景:
我們把可變字符串 s3 指向了 s1 的地址,然后改變 s3 的值,由于 StringBuilder 沒有像String 那樣設(shè)計(jì)成不可變的,所以 s3 就會(huì)直接在 s1 的地址上進(jìn)行修改,導(dǎo)致 s1 的值也發(fā)生了改變。于是,糟糕的事情發(fā)生了,HashSet 中出現(xiàn)了兩個(gè)相等的元素,破壞了 HashSet 的不包含重復(fù)元素的原則。
另外,在多線程環(huán)境下,眾所周知,多個(gè)線程同時(shí)想要修改同一個(gè)資源,是存在危險(xiǎn)的,而String 作為不可變對(duì)象,不能被修改,并且多個(gè)線程同時(shí)讀同一個(gè)資源,是完全沒有問題的,所以 String 是線程安全的。
String 真的不可變嗎?
想要改變 String 無非就是改變 char 數(shù)組 value 的內(nèi)容,而 value 是私有屬性,那么在 Java 中有沒有某種手段可以訪問類的私有屬性呢?
沒錯(cuò),就是反射,使用反射可以直接修改 char 數(shù)組中的內(nèi)容,當(dāng)然,一般來說我們不這么做。
看下面代碼:
總結(jié)
總結(jié)來說,并不是因?yàn)?char 數(shù)組是 final 才導(dǎo)致 String 的不可變,而是為了把 String 設(shè)計(jì)成不可變才把 char 數(shù)組設(shè)置為 final 的。下面是一些創(chuàng)建不可變對(duì)象的簡(jiǎn)單策略,當(dāng)然,也并非所有不可變類都完全遵守這些規(guī)則:
- 不要提供 setter 方法(包括修改字段的方法和修改字段引用對(duì)象的方法);
- 將類的所有字段定義為 final、private 的;
- 不允許子類重寫方法。簡(jiǎn)單的辦法是將類聲明為 final,更好的方法是將構(gòu)造函數(shù)聲明為私有的,通過工廠方法創(chuàng)建對(duì)象;
- 如果類的字段是對(duì)可變對(duì)象的引用,不允許修改被引用對(duì)象。