JVM 君,你是不過(guò)分了
JVM 對(duì) Java 有多重要,對(duì)程序員面試有多重要,這些不用多說(shuō)。
如果你還沒(méi)意識(shí)到學(xué) JVM 的必要性,或者不知道怎么學(xué) JVM,那么看完這篇文章,你就能知道答案了。
曾經(jīng)的我很不屑于學(xué) JVM,但是后來(lái)發(fā)現(xiàn)不學(xué)不行。這就像和媳婦吵架之后我不想道歉一樣,不道歉那是不可能的,道歉是早晚的事兒,逃不掉。
后來(lái)我明白了:
認(rèn)慫越晚,結(jié)局越慘。
但是我學(xué)的時(shí)候才知道:JVM,你太過(guò)分了,太難學(xué)了!
我的學(xué)習(xí)過(guò)程可以說(shuō)非??部?,不過(guò)經(jīng)歷坎坷之后,我倒是發(fā)現(xiàn)學(xué) JVM 的門(mén)道很多。
以我的經(jīng)驗(yàn)加上和同行們的交流,我認(rèn)為學(xué) JVM 最好的方法是:
在程序員不同的水平段,做精準(zhǔn)的學(xué)習(xí)。
所謂的精準(zhǔn)學(xué)習(xí),就是學(xué)習(xí)對(duì)自己工作有巨大幫助的知識(shí)點(diǎn)。以工作內(nèi)容帶動(dòng)學(xué)習(xí),等到積累多了,再一舉攻克所有 JVM 知識(shí)點(diǎn),最終熟練掌握 JVM 底層原理。
下面我來(lái)說(shuō)說(shuō)初級(jí)、高級(jí)、資深程序員,如何循序漸進(jìn)、分步學(xué)習(xí)。
初級(jí)程序員怎么學(xué)
對(duì)剛?cè)胄械男率殖绦騿T,工作一般是修復(fù)簡(jiǎn)單 bug、開(kāi)發(fā)簡(jiǎn)單功能。如何編碼少出 bug,是這個(gè)階段的核心問(wèn)題。
對(duì)于這個(gè)核心問(wèn)題,JVM 原理必須深入掌握兩個(gè)知識(shí)點(diǎn)。
1. 類(lèi)的初始化
類(lèi)的初始化,要了解的非常深入才可以。否則,一不留神就會(huì)往項(xiàng)目里引入一些有關(guān)初始化的 bug。
比如看看下面這段代碼:
- public class ParentClass {
- private int parentX;
- public ParentClass() {
- setX(100);
- }
- public void setX(int x) {
- parentX = x;
- }
- }
- public class ChildClass extends ParentClass{
- private int childX = 1;
- public ChildClass() {}
- @Override
- public void setX(int x) {
- super.setX(x);
- childX = x;
- System.out.println("ChildX 被賦值為 " + x);
- }
- public void printX() {
- System.out.println("ChildX = " + childX);
- }
- }
- public class TryInitMain {
- public static void main(String[] args) {
- ChildClass cc = new ChildClass();
- cc.printX();
- }
- }
有興趣可以運(yùn)行看看結(jié)果,一旦把這種代碼放到了生產(chǎn)環(huán)境里,排查非常困難。
2. Java 內(nèi)存結(jié)構(gòu)和對(duì)象分配
第二個(gè)知識(shí)點(diǎn),就是 Java 內(nèi)存結(jié)構(gòu)和對(duì)象分配的基礎(chǔ)知識(shí),尤其是 JVM 內(nèi)存中堆的布局和對(duì)象分配的關(guān)系。
比如,堆內(nèi)存的布局
當(dāng)然,Java7 后,新布局變了
知道布局了,就得知道java對(duì)象分配的基本原則:
- 對(duì)象優(yōu)先在Eden區(qū)分配
- 對(duì)象太大直接會(huì)分配到老年代
只有知道這些知識(shí),才不會(huì)經(jīng)常寫(xiě)下底下這種 bug:
- // 將全部行數(shù)讀取的內(nèi)存中
- List<String> lines = FileUtils.readLines(new File("temp/test.txt"), Charset.defaultCharset());
- for (String line : lines) {
- // pass
- }
上面這段代碼,一旦讀取到了大文件,很可能把生產(chǎn)環(huán)境搞崩。
所以,把上述兩個(gè)知識(shí)點(diǎn)深入理解了,對(duì)新手提升自己的代碼質(zhì)量非常非常有用。只有代碼質(zhì)量上去了,你才能得到更好的發(fā)展。
對(duì)于這兩個(gè)知識(shí)點(diǎn),我認(rèn)為通過(guò)網(wǎng)絡(luò)的文章去學(xué)習(xí)最好。如果直接看書(shū),有兩個(gè)最大的缺點(diǎn):
- 知識(shí)積累不足導(dǎo)致學(xué)不懂
- 書(shū)中冗余知識(shí)點(diǎn)太多,互相交雜,精力耗費(fèi)過(guò)大,性?xún)r(jià)比不高
故這里學(xué)習(xí)推薦根據(jù)知識(shí)點(diǎn)去搜文章讀,而不是找原理性的書(shū)籍看。
高級(jí)程序員怎么學(xué)
對(duì)處于這個(gè)階段的朋友,他們已經(jīng)可以熟練編寫(xiě)健壯的代碼了,經(jīng)常會(huì)獨(dú)立開(kāi)發(fā)出一個(gè)大的功能模塊,有的可能還能獨(dú)立開(kāi)發(fā)出一個(gè)完整的小型項(xiàng)目。
這時(shí)候,他們可能會(huì)面臨兩種情況:
1. 需要寫(xiě)一些工具類(lèi)給全團(tuán)隊(duì)使用
在這種情況下,你很可能就需要 Java 中的語(yǔ)法糖,因?yàn)檎Z(yǔ)法糖能讓你寫(xiě)出非常靈活簡(jiǎn)單的代碼。這包括泛型,自動(dòng)拆裝箱,可變參數(shù)還有遍歷循環(huán)。
但是,使用這些語(yǔ)法糖的時(shí)候,如果你不熟悉他們?cè)?JVM 中的實(shí)現(xiàn)原理,就非常容易栽個(gè)大跟頭,
比如:
- public class GenericPitfall {
- public static void main(String[] args) {
- List list = new ArrayList();
- list.add("123");
- List<Integer> list2 = list;
- System.out.println(list2.get(0).intValue());
- }
- }
2. 編寫(xiě)性能優(yōu)越的代碼
什么時(shí)候需要性能優(yōu)越的代碼?最常見(jiàn)的就是把以前性能不好的同步實(shí)現(xiàn),轉(zhuǎn)化成異步實(shí)現(xiàn)。
而這種要求,就需要開(kāi)發(fā)對(duì) Java 的多線程開(kāi)發(fā)非常熟悉,并且一定要深入理解多線程在 JVM 中的原理實(shí)現(xiàn)。
不然,可以看看下面這段代碼:
- class IncompletedSynchronization {
- int x;
- public int getX() {
- return x;
- }
- public synchronized void setX(int x) {
- this.x = x;
- }
- }
再看看這段:
- Object lock = new Object();
- synchronized (lock) {
- lock = new Object();
- }
如果把上面這些代碼上了生產(chǎn)環(huán)境,熬通宵排查問(wèn)題的命運(yùn)就注定了……
這里的知識(shí)點(diǎn),我推薦通過(guò)網(wǎng)上的文章看,又因?yàn)樯婕暗搅瞬l(fā)知識(shí),我建議就著《Java Performance》第二版的“Chapter 9. Threading and Synchronization Performance”這章一起看。
還有余力,建議再繼續(xù)看周志明的那本《深入理解 JAVA 虛擬機(jī)》第三版中的 12-13 章。周志明這本書(shū)講的十分深入,也帶來(lái)個(gè)缺點(diǎn):門(mén)檻高。此時(shí),如果沒(méi)看懂可以放一放。
注意,我這里說(shuō)的是并發(fā)的原理,不是并發(fā)實(shí)踐,讀者想學(xué)并發(fā)編程,《JAVA 并發(fā)編程實(shí)踐》我認(rèn)為是前提條件,故不會(huì)贅述。
資深程序員怎么學(xué)
這時(shí)候的你,已經(jīng)開(kāi)始承擔(dān)項(xiàng)目開(kāi)發(fā)中很重要的職責(zé)了,有些出色的朋友都開(kāi)始帶團(tuán)隊(duì)了。那這時(shí)候,你可能會(huì)做下面的事:
1. 合理規(guī)劃項(xiàng)目使用資源
合理規(guī)劃項(xiàng)目使用資源,前提是對(duì)垃圾回收有非常深入的了解。
如果說(shuō)在新手期,已經(jīng)對(duì) Java 對(duì)象的內(nèi)存分配和內(nèi)存使用有了大致的概念,那么,這個(gè)垃圾回收,則是這類(lèi)知識(shí)的進(jìn)一步拓展。
只有理解了各種垃圾回收的原理,再配合著 Java 內(nèi)存布局的基礎(chǔ)知識(shí),才能更好地規(guī)劃出項(xiàng)目用什么回收算法,才能在合適的資源利用度上得到最佳性能。
比如,新生代和老年代之間的合適比例。比如,新生代中 Eden 和 Survivor 區(qū)域間的比例。
2. 排查各種線上問(wèn)題
要排查各種問(wèn)題,就需要對(duì) JVM 提供的各種故障排查工具非常了解。
這些工具又分為兩類(lèi):
- 基礎(chǔ)的命令行形式的故障處理工具,比如 jps、jstack 等等
- 第二類(lèi)是可視化的故障處理工具,比如 VisualVM
但是,掌握工具的使用還不夠。因?yàn)橛嘘P(guān)垃圾回收的問(wèn)題,還必須得通過(guò)解析 GC 日志后,再通過(guò)工具的使用,才可能能定位到問(wèn)題的根源。
所以,最好對(duì)使用故障排查工具和 GC 日志都非常熟練。
比如:
- 2021-05-26T14:45:37.987-0200: 151.126:
- [GC (Allocation Failure) 151.126: [DefNew: 629119K->69888K(629120K), 0.0584157 secs] 1619346K->1273247K(2027264K), 0.0585007 secs]
- [Times: user=0.06 sys=0.00, real=0.06 secs]
- 2021-05-26T14:45:59.690-0200: 172.829:
- [GC (Allocation Failure) 172.829: [DefNew: 629120K->629120K(629120K), 0.0000372 secs]172.829: [Tenured: 1203359K->755802K(1398144K), 0.1855567 secs] 1832479K->755802K(2027264K), [Metaspace: 6741K->6741K(1056768K)], 0.1856954 secs]
- [Times: user=0.18 sys=0.00, real=0.18 secs]
上面這條,應(yīng)該一眼看出來(lái),垃圾算法用的是 Serial 收集器,并且年輕代分配出現(xiàn)了問(wèn)題,大小可能需要調(diào)整。
這里的知識(shí)點(diǎn),強(qiáng)烈反對(duì)看網(wǎng)上的文章,網(wǎng)上說(shuō)的很多細(xì)節(jié)有問(wèn)題,疏漏很多。所以,推薦看書(shū)。
《Java Performance》第二版里,“Chapter 5. An Introduction to Garbage Collection”,“Chapter 6. Garbage Collection Algorithms”的知識(shí)已經(jīng)足夠。
有人去看《深入理解 JAVA 虛擬機(jī)》第三版中的第 3 章,講垃圾收集器與內(nèi)存分配策略的。這里還是老問(wèn)題,講的太細(xì),我建議繞過(guò) 3.4 節(jié),講 HotSpot 算法細(xì)節(jié)的那塊兒。
這里安全點(diǎn)這個(gè)知識(shí)點(diǎn)挺重要,但是現(xiàn)在這個(gè)階段想理解挺難的。我覺(jué)得將來(lái)做一些底層框架,接觸到崩潰恢復(fù)的 checkpoint 相關(guān)思想了,再回頭來(lái)學(xué)習(xí),那才能真正理解和掌握。
技術(shù)專(zhuān)家怎么學(xué)
達(dá)到這個(gè)級(jí)別了,那就需要對(duì)整套 JVM 要有非常深入的了解了,因?yàn)槟闶墙鉀Q技術(shù)問(wèn)題的最后保障了。有些時(shí)候,甚至還需要因?yàn)槟承﹩?wèn)題開(kāi)發(fā)出各種各樣的工具。
曾經(jīng),有個(gè)項(xiàng)目時(shí)不時(shí)總是會(huì)報(bào)錯(cuò):
- java.lang.OutOfMemoryError: GC overhead limit exceeded
這個(gè)問(wèn)題幾個(gè)同事都沒(méi)搞定,就來(lái)找我。我看了看,突然想起來(lái),以前在官方調(diào)優(yōu)指南《HotSpot Virtual Machine Garbage Collection Tuning Guide》看到過(guò)相關(guān)介紹。
JVM 本身內(nèi)存不足就會(huì)運(yùn)行 GC,但是如果每次 GC 回收的內(nèi)存不夠,那么很快就會(huì)開(kāi)始下一次 GC。
JVM 有個(gè)默認(rèn)的保護(hù)機(jī)制,如果發(fā)現(xiàn)在一個(gè)統(tǒng)計(jì)周期內(nèi),98% 的時(shí)間都是在運(yùn)行 GC,內(nèi)存回收卻少于 2% 的時(shí)候,就會(huì)報(bào)這個(gè)錯(cuò)。
怎么引起的呢?這個(gè)問(wèn)題如果去排查代碼,那真的是難如登天,首先,沒(méi)有任何堆棧錯(cuò)誤去幫助定位問(wèn)題。其次,項(xiàng)目代碼量大了去了,而且是年頭久遠(yuǎn)。
這時(shí),就需要通過(guò)對(duì) JVM 總體的深入理解,去反推問(wèn)題了。我當(dāng)時(shí)是這樣推理的:
內(nèi)存溢出,GC 無(wú)法回收問(wèn)題,說(shuō)明了兩個(gè)問(wèn)題:
- 堆內(nèi)的內(nèi)存不夠用了
- 占用內(nèi)存的對(duì)象要么就是該關(guān)閉的資源沒(méi)有關(guān)閉,要么被大量的暫時(shí)放在一起了
那如果我 dump 出內(nèi)存文件出來(lái),再分析下就知道是哪些對(duì)象在占用內(nèi)存了。
一查發(fā)現(xiàn)是大量的字符串在占用內(nèi)存。
綜合我前面的推測(cè),字符串不是數(shù)據(jù)庫(kù)連接,肯定沒(méi)有該關(guān)閉未關(guān)閉的問(wèn)題。那就剩一個(gè)可能了,就是被大量的暫時(shí)放起來(lái)了,導(dǎo)致 GC 回收不了。
那么新問(wèn)題來(lái)了,能大量放字符串的,會(huì)是什么?
首先就去猜緩存。根據(jù)這條線索,直接去源碼搜 Cache 關(guān)鍵詞,把所有關(guān)于 Cache 的代碼都看了下。一下子就找到問(wèn)題了。
原來(lái),我們有個(gè)功能是解析一個(gè)非常大的文件。文件的格式如下:
需要把這個(gè)文件的每一行內(nèi)容按照列去一起存到數(shù)據(jù)庫(kù)里。
由于寫(xiě)代碼的人偷懶,想一次解析完畢后一股腦全塞到數(shù)據(jù)庫(kù)里。所以,他弄了個(gè) Map,Map 的 Key 是相同的列名,Value是每一行解析過(guò)的內(nèi)容。
而這樣寫(xiě)代碼的結(jié)果就是,一行對(duì)應(yīng)了一個(gè)有三個(gè)條目的 HashMap。如果文件有十幾萬(wàn)行,就有十幾萬(wàn)的 HashMap。然后,這些 HashMap 再存到一個(gè)列表里,再把這個(gè)列表放到一個(gè)叫做 xxxCache 的 HashMap 中。
示意代碼如下:
- public class ParseFile4OOM {
- public static void main(String[] args) {
- List<Map<String, String>> lst = new ArrayList<>();
- for (int i = 0; i < 100000; i++) {
- Map<String, String> map = new HashMap<>();
- map.put("Column1", "Content1");
- map.put("Column2", "Content2");
- map.put("Column3", "Content3");
- lst.add(map);
- }
- Map<String, List<Map<String, String>>> contentCache = new HashMap<>();
- contentCache.put("contents", lst);
- }
- }
那對(duì)這種情況怎么辦呢?代碼還不能大動(dòng),只能優(yōu)化。
那時(shí),我們已經(jīng)用了 JDK8 了,引入了 String 常量池。同時(shí),Hashmap 在這個(gè)業(yè)務(wù)場(chǎng)景下,容積是固定的,所以,就不應(yīng)該給它多分配空間,就固定死為 3。
優(yōu)化后,代碼如下:
- public class ParseFile4OOM {
- public static void main(String[] args) {
- List<Map<String, String>> lst = new ArrayList<>();
- for (int i = 0; i < 100000; i++) {
- Map<String, String> map = new HashMap<>(3);
- map.put("Column1".intern(), "Content1".intern());
- map.put("Column2".intern(), "Content2".intern());
- map.put("Column3".intern(), "Content3".intern());
- lst.add(map);
- }
- Map<String, List<Map<String, String>>> contentCache = new HashMap<>();
- contentCache.put("contents".intern(), lst);
- }
- }
把優(yōu)化后的代碼上線,錯(cuò)誤搞定了!
所以,在這個(gè)階段就非得把 JVM 吃透不可了。吃透原理就必須靠看書(shū)了。
周志明的《深入理解 JAVA 虛擬機(jī)》是必須的了,但是還不夠。
《Oracle JRockit: The Definitive Guide》這本書(shū)我也建議讀一讀,雖然老了,但是里面的很多內(nèi)容,尤其前四章,對(duì) JVM 原理真的快講透了。對(duì) JVM 是如何彈性伸縮去平衡資源和性能關(guān)系的,娓娓道來(lái),讓我醍醐灌頂,編程視野一下子打開(kāi)了很多。
至此,不同階段的學(xué)習(xí)方法講完了。
總的來(lái)說(shuō),JVM 知識(shí)廣博復(fù)雜,如果想要掌握,不能一蹴而就。而且咱們程序員不容易,需要學(xué)的知識(shí)太多,然而咱們的精力卻是有限的。
所以,對(duì)于 JVM 原理來(lái)說(shuō),假設(shè)有些知識(shí)點(diǎn)眼前看不懂,用不上,可以先暫時(shí)放一放,做到精準(zhǔn)學(xué)習(xí),把省下來(lái)的精力用在別的知識(shí)甚至自己的生活上,更有意義。
看完如果覺(jué)得有收獲,希望能幫忙轉(zhuǎn)發(fā)、隨手點(diǎn)個(gè)在看,你的支持對(duì)我很重要。
你好,我是四猿外。
一家上市公司的技術(shù)總監(jiān),管理的技術(shù)團(tuán)隊(duì)一百余人。
我從一名非計(jì)算機(jī)專(zhuān)業(yè)的畢業(yè)生,轉(zhuǎn)行到程序員,一路打拼,一路成長(zhǎng)。
本文轉(zhuǎn)載自微信公眾號(hào)「四猿外」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系四猿外公眾號(hào)。