淺析JVM崩潰的原因及解決方法
- #
- # An unexpected error has been detected by HotSpot Virtual Machine:
- #
- # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x009fcf52, pid=4752, tid=4440
- #
- # Java VM: Java HotSpot(TM) Client VM (1.5.0_14-b03 mixed mode)
- # Problematic frame:
- # V [jvm.dll+0x9cf52]
- #
- # An error report file with more information is saved as hs_err_pid4752.log
- #
- # If you would like to submit a bug report, please visit:
- # http://java.sun.com/webapps/bugreport/crash.jsp
- #
我只不過是想通過C++生成一個Java的Date對象,然后輸出當(dāng)前時間。通過這點(diǎn)錯誤信息我們大概可以知道的是
JVM crash了,輸出錯誤到hs_err_pid4752.log日志。
結(jié)果運(yùn)行死活都報(bào)這個錯,也產(chǎn)生了一個log錯誤日志。其實(shí)運(yùn)行一次產(chǎn)生一個,錯都一樣,我只舉其中一個:
為了防止本機(jī)信息泄露,我把路徑屏掉。
- #
- # An unexpected error has been detected by HotSpot Virtual Machine:
- #
- # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x009fcf52, pid=4344, tid=5876
- #
- # Java VM: Java HotSpot(TM) Client VM (1.5.0_14-b03 mixed mode)
- # Problematic frame:
- # V [jvm.dll+0x9cf52]
- #
- --------------- T H R E A D ---------------
- Current thread (0x00823d30): JavaThread "main" [_thread_in_vm, id=5876]
- siginfo: ExceptionCode=0xc0000005, reading address 0x00000000
- Registers:
- EAX=0x00000000, EBX=0x06f8c0f8, ECX=0x0006f954, EDX=0x00823df0
- ESP=0x0006f934, EBP=0x0006f980, ESI=0x0006f954, EDI=0x0006f9e8
- EIP=0x009fcf52, EFLAGS=0x00010246
- Top of Stack: (sp=0x0006f934)
- 0x0006f934: 009eb893 00000000 00823d30 009ecac3
- 0x0006f944: 00823d30 00000000 0006f9fc 0006f998
- 0x0006f954: 00823df0 0082b438 009a1e20 00823d30
- 0x0006f964: 0006f980 009ebb6a 00823d30 0000000e
- 0x0006f974: 00000004 0006f9e8 0006f998 0006f9e8
- 0x0006f984: 1000148b 00823df0 0082b434 00000000
- 0x0006f994: 0006f9fc 0006fa5c 06f8c0f8 06f8c0f8
- 0x0006f9a4: cccccccc cccccccc cccccccc cccccccc
- Instructions: (pc=0x009fcf52)
- 0x009fcf42: 44 24 04 24 fc 8b 00 8b 00 c3 8b 44 24 04 24 fc
- 0x009fcf52: 8b 00 ff 74 24 04 8b c8 e8 93 fe ff ff c3 8b 44
- Stack: [0x00030000,0x00070000), sp=0x0006f934, free space=254k
- Native frames: (J=compiled Java code, j=interpreted, Vv=VM code, C=native code)
- V [jvm.dll+0x9cf52]
- C [NativeCode.dll+0x148b]
- C [NativeCode.dll+0x1253]
- j com.sy.test.TestNative.sayHello()V+0
- j com.sy.test.TestNative.main([Ljava/lang/String;)V+22
- v ~StubRoutines::call_stub
- V [jvm.dll+0x875dd]
- V [jvm.dll+0xdfd96]
- V [jvm.dll+0x874ae]
- V [jvm.dll+0x8e6f1]
- C [javaw.exe+0x14c5]
- C [javaw.exe+0x3151]
- C [kernel32.dll+0x16fd7]
- Java frames: (J=compiled Java code, j=interpreted, Vv=VM code)
- j com.sy.test.TestNative.sayHello()V+0
- j com.sy.test.TestNative.main([Ljava/lang/String;)V+22
- v ~StubRoutines::call_stub
- --------------- P R O C E S S ---------------
- Java Threads: ( => current thread )
- 0x008306d0 JavaThread "Low Memory Detector" daemon [_thread_blocked, id=5624]
- 0x0082fb30 JavaThread "CompilerThread0" daemon [_thread_blocked, id=5988]
- 0x0082e8c0 JavaThread "Signal Dispatcher" daemon [_thread_blocked, id=2400]
- 0x0082de70 JavaThread "Finalizer" daemon [_thread_blocked, id=5704]
- 0x0082ccf0 JavaThread "Reference Handler" daemon [_thread_blocked, id=4240]
- =>0x00823d30 JavaThread "main" [_thread_in_vm, id=5876]
- Other Threads:
- 0x0082a060 VMThread [id=1960]
- 0x00831270 WatcherThread [id=5708]
- VM state:not at safepoint (normal execution)
- VM Mutex/Monitor currently owned by a thread: None
- Heap
- def new generation total 576K, used 209K [0x02de0000, 0x02e80000, 0x032c0000)
- eden space 512K, 40% used [0x02de0000, 0x02e14510, 0x02e60000)
- from space 64K, 0% used [0x02e60000, 0x02e60000, 0x02e70000)
- to space 64K, 0% used [0x02e70000, 0x02e70000, 0x02e80000)
- tenured generation total 1408K, used 0K [0x032c0000, 0x03420000, 0x06de0000)
- the space 1408K, 0% used [0x032c0000, 0x032c0000, 0x032c0200, 0x03420000)
- compacting perm gen total 8192K, used 1715K [0x06de0000, 0x075e0000, 0x0ade0000)
- the space 8192K, 20% used [0x06de0000, 0x06f8cdb0, 0x06f8ce00, 0x075e0000)
- No shared spaces configured.
- Dynamic libraries:
- 0x00400000 - 0x0040d000 *******************************
- 0x7c920000 - 0x7c9b4000 C:\WINDOWS\system32\ntdll.dll
- 0x7c800000 - 0x7c91d000 C:\WINDOWS\system32\kernel32.dll
- 0x77da0000 - 0x77e49000 C:\WINDOWS\system32\ADVAPI32.dll
- 0x77e50000 - 0x77ee2000 C:\WINDOWS\system32\RPCRT4.dll
- 0x77fc0000 - 0x77fd1000 C:\WINDOWS\system32\Secur32.dll
- 0x77d10000 - 0x77d9f000 C:\WINDOWS\system32\USER32.dll
- 0x77ef0000 - 0x77f38000 C:\WINDOWS\system32\GDI32.dll
- 0x77be0000 - 0x77c38000 C:\WINDOWS\system32\MSVCRT.dll
- 0x76300000 - 0x7631d000 C:\WINDOWS\system32\IMM32.DLL
- 0x62c20000 - 0x62c29000 C:\WINDOWS\system32\LPK.DLL
- 0x73fa0000 - 0x7400b000 C:\WINDOWS\system32\USP10.dll
- 0x6d710000 - 0x6d723000 C:\PROGRA~1\KASPER~1\KASPER~1\mzvkbd.dll
- 0x76bc0000 - 0x76bcb000 C:\WINDOWS\system32\PSAPI.DLL
- 0x6d730000 - 0x6d743000 C:\PROGRA~1\KASPER~1\KASPER~1\mzvkbd3.dll
- 0x6d020000 - 0x6d035000 C:\PROGRA~1\KASPER~1\KASPER~1\adialhk.dll
- 0x77f40000 - 0x77fb6000 C:\WINDOWS\system32\SHLWAPI.dll
- 0x6d4c0000 - 0x6d4c6000 C:\PROGRA~1\KASPER~1\KASPER~1\kloehk.dll
- 0x00960000 - 0x00afe000 *******************************
- 0x76b10000 - 0x76b3a000 C:\WINDOWS\system32\WINMM.dll
- 0x6d290000 - 0x6d298000 *******************************
- 0x6d610000 - 0x6d61c000 *******************************
- 0x6d310000 - 0x6d32d000 *******************************
- 0x6d630000 - 0x6d63f000 *******************************
- 0x10000000 - 0x1004e000 *******************************
- VM Arguments:
- java_command: com.sy.test.TestNative
- Launcher Type: SUN_STANDARD
- Environment Variables:
- JAVA_HOME=*******************************
- CLASSPATH=*******************************
- PATH=*******************************
- USERNAME=user
- OS=Windows_NT
- PROCESSOR_IDENTIFIER=x86 Family 6 Model 14 Stepping 8, GenuineIntel
- --------------- S Y S T E M ---------------
- OS: Windows XP Build 2600 Service Pack 2
- CPU:total 1 (cores per cpu 1, threads per core 1) family 6 model 14 stepping 8, cmov, cx8, fxsr, mmx, sse, sse2
- Memory: 4k page, physical 1300464k(465904k free), swap 3092560k(2157304k free)
- vm_info: Java HotSpot(TM) Client VM (1.5.0_14-b03) for windows-x86, built on Oct 5 2007 01:21:52 by "java_re" with MS VC++ 6.0
看到就些錯誤日志就可以斷定是由于我用Java的主函數(shù)調(diào)用本地dll文件時出了錯。
我初步推斷是因?yàn)槲业腃++產(chǎn)生Java對象傳給Java類后,沒有回收。導(dǎo)致內(nèi)存泄露。
但是因?yàn)槲沂浅鯇W(xué)者,所以對C++控制Java還不熟,所以經(jīng)過調(diào)試,C++編譯通不過。由于最近考試壓力
實(shí)在太大,迫使我先暫且放下這個問題。
但是不解決心里不爽,于是開始了搜索》》》》》》》》》》》》》》》漫長的信息檢索》》》》》》》
發(fā)現(xiàn)新大陸》》》》》》》》》
#p#
以下內(nèi)容,轉(zhuǎn)載自http://developers.sun.com.cn/blog/yutoujava/
Java的應(yīng)用有時候會因?yàn)楦鞣N原因Crash,這時候會產(chǎn)生一個類似java_errorpid.log的錯誤日志。可以拿到了
這個日志,怎樣分析Crash的原因呢?下面我們來詳細(xì)討論如何分析java_errorpid.log的錯誤日志。
一. 如何得到這個日志文件
如果有一個嚴(yán)重的錯誤引起Java進(jìn)程非正常退出,我們叫Crash,這時候會產(chǎn)生一個日志文件。缺省情況下,這個
文件會產(chǎn)生在工作目錄下。但是,可以在Java啟動參數(shù)通過下面的設(shè)置,來改變這個文件的位置和命名規(guī)則。例如:
java -XX:ErrorFile=/var/log/java/java_error_%p.log
就將這個錯誤文件放在/var/log/java下,并且以java_error_pid.log的形式出現(xiàn)。
二.產(chǎn)生錯誤的原因
造成嚴(yán)重錯誤的原因有多種可能性。Java虛擬機(jī)自身的Bug是原因之一,但是這種可能不是很大。在絕大多數(shù)情況下,是由于系統(tǒng)的庫文件、API或第三方的庫文件造成的;系統(tǒng)資源的短缺也有可能造成這種嚴(yán)重的錯誤。在發(fā)生了Crash之后,如果無法定位根本原因,也應(yīng)該迅速找到Work Around的方法。
三.對日志文件的分析
首先要檢查日志的文件頭:例如,下面是從一個客戶發(fā)過來的錯誤日志的文件頭
- -------------------------------------
- #
- # An unexpected error has been detected by HotSpot Virtual Machine:
- #
- # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x0815e87e, pid=7268, tid=4360
- #
- # Java VM: Java HotSpot(TM) Server VM (1.4.2_13-b06 mixed mode)
- # Problematic frame:
- # V [jvm.dll+0x15e87e]
- #
- --------------------------------------
文件頭中有很多有用的信息,“EXCEPTION_ACCESS_VIOLATION ”意味著Java應(yīng)用Crash的時候,正在運(yùn)行JVM自己的代碼,而不是外部的Java代碼或其他類庫代碼。這種情況很可能是JVM的Bug,但是也不一定。除了“EXCEPTION_ACCESS_VIOLATION ”,還有可能是別的信息,例如“SIGSEGV(0xb)”,意味著JVM正在執(zhí)行本地或JNI的代碼;“EXCEPTION_STACK_OVERFLOW”意味著這是個棧溢出的錯誤。(**********看到這里我們知道我報(bào)錯時正在運(yùn)行JVM自己的代碼,而不是外部的Java代碼或其他類庫代碼*********)
另外一個有用的JVM崩潰信息就是:
- # Problematic frame:
- # V [jvm.dll+0x15e87e]
它說明Crash的時候,JVM正在從哪個庫文件執(zhí)行代碼。除了“V”以外,還有可能是“C”、“j”、“v”、“J”。具體的表示意思如下:
- FrameType Description:
- C: Native C frame
- j: Interpreted Java frame
- V: VMframe
- v: VMgenerated stub frame
- J: Other frame types, including compiled Java frames
- (**********看到這里我們知道我報(bào)錯時是V: VMframe這種情況*********)
文件頭之后,是當(dāng)前線程的DUMP信息,線程之后是JVM進(jìn)程的DUMP信息,包括所有線程的狀態(tài)、地址和ID。最后還有JVM狀態(tài),
Heap狀態(tài),動態(tài)連接庫等等的信息。這些煩亂的信息中,包含有非常有用的信息。下面我們根據(jù)幾個具體的實(shí)例來分析JVM崩潰的典型例子。
四.內(nèi)存回收引起的Crash
內(nèi)存回收引起的Crash有以下的特點(diǎn):在日志文件頭一般有“ EXCEPTION_ACCESS _VIOLATION”和
“# Problematic frame: # V [jvm.dll+....”的信息,意味著這是在JVM內(nèi)部處理,而且多半是JVM的Bug。
(**********看到這里我們知道我報(bào)錯時意味著這是在JVM內(nèi)部處理,而且多半是JVM的Bug*********)
對于這類問題,最快的方法就是繞過它。
另外,在Thread的DUMP信息最后,還能看到有關(guān)內(nèi)存回收的行為例如:
- --------------- T H R E A D ---------------
- Current thread (0x00a56668): VMThread [id=4360]
- siginfo: ExceptionCode=0xc0000005, reading address 0x00000057
- Registers:
- ........
- Stack: [0x03cf0000,0x03d30000), sp=0x03d2fc18, free space=255k
- Native frames: (J=compiled Java code, j=interpreted, Vv=VM code, C=native code)
- V [jvm.dll+0x15e87e]
- VM_Operation (0x063efbac): full generation collection, mode: safepoint, requested by thread 0x040f83f8
- ------------------------------------------------------------
可以清楚的看到JVM正在做 “full generation collection”。另外還有可能看到,其他的回收行為:
對于內(nèi)存回收的錯誤,一般
- generation collection for allocation
- full generation collection
- parallel gc failed allocation
- parallel gc failed permanent allocation
- parallel gc system gc
- (***********這些錯,俺都沒碰到***********)
采取改變回收的算法和參數(shù)的方法來繞過去。例如,來自客戶的日志除了上面的日志信息,在日志中Heap信息中還能發(fā)現(xiàn)一些其他信息:
- --------------------------------------------------------------
- Heap
- def new generation total 22592K, used 19530K [0x10010000, 0x11890000, 0x138f0000)
- eden space 20096K, 97% used [0x10010000, 0x11322bd8, 0x113b0000)
- from space 2496K, 0% used [0x113b0000, 0x113b0000, 0x11620000)
- to space 2496K, 0% used [0x11620000, 0x11620000, 0x11890000)
- tenured generation total 190696K, used 100019K [0x138f0000, 0x1f32a000, 0x30010000)
- the space 190696K, 52% used [0x138f0000, 0x19a9cf38, 0x19a9d000, 0x1f32a000)
- compacting perm gen total 38656K, used 38588K [0x30010000, 0x325d0000, 0x34010000)
- the space 38656K, 99% used [0x30010000, 0x325bf038, 0x325bf200, 0x325d0000)
- ----------------------------------------------------------------
上面的信息能看出在Crash的時候,JVM的PermSize空間幾乎已經(jīng)消耗完了,并且回收算法在壓縮Perm空間的時候出了錯。因此,建議改變內(nèi)存回收的算法,或擴(kuò)大PermSize和MaxPermSize的數(shù)值。
(*******這個倒是可以嘗試*******)
五.棧溢出引起的Crash
Java代碼引起的棧溢出,通常不會引起JVM的Crash,而是拋出一個Java異常:java.lang.StackOverflowError。但是在Java虛擬機(jī)中,Java的代碼和本地C或C++代碼公用相同的Stack。這樣,在執(zhí)行本地代碼所造成的棧溢出,就有可能引起JVM的Crash了。棧溢出引起的Crash會在日志的文件頭中看到“EXCEPTION_STACK_OVERFLOW”字樣。另外,在當(dāng)前線程的Stack信息中也能發(fā)現(xiàn)一些信息。例如下面的例子:
- -----------------------------------------------------------------------------------
- # An unexpected error has been detected by HotSpot Virtual Machine:
- #
- # EXCEPTION_STACK_OVERFLOW (0xc00000fd) at pc=0x10001011, pid=296, tid=2940
- #
- # Java VM: Java HotSpot(TM) Client VM (1.6-internal mixed mode, sharing)
- # Problematic frame:
- # C [App.dll+0x1011]
- #
- --------------- T H R E A D ---------------
- Current thread (0x000367c0): JavaThread "main" [_thread_in_native, id=2940]
- :
- Stack: [0x00040000,0x00080000), sp=0x00041000, free space=4k
- Native frames: (J=compiled Java code, j=interpreted, Vv=VM code, C=native code)
- C [App.dll+0x1011]
- C [App.dll+0x1020]
- C [App.dll+0x1020]
- :
- C [App.dll+0x1020]
- C [App.dll+0x1020]
- ......
- Java frames: (J=compiled Java code, j=interpreted, Vv=VM code)
- j Test.foo()V+0
- j Test.main([Ljava/lang/String;)V+0
- v ~StubRoutines::call_stub
- --------------------------------------------------------------------------------
在上面的信息中,可以發(fā)現(xiàn)這是個棧溢出的錯誤。并且當(dāng)前棧剩余的空間已經(jīng)很小了(free space =4k)。
因此建議將JVM的Stack的尺寸調(diào)大,主要設(shè)計(jì)兩個參數(shù):“-Xss” 和“-XX:StackShadowPages=n”。但是,將棧的尺寸調(diào)大,也意味著在有限的內(nèi)存資源中,能打開的最大線程數(shù)會減少。(******俺的棧剩余還有free space=254k,顯然不符,于是乎我決定假期再解決,o(∩_∩)o...******)
JVM崩潰的原因及解決方法結(jié)論:
我覺得還是C++建立Java對象后,沒有回收。鑒定完畢
【編輯推薦】