不經(jīng)意的兩行代碼把CPU使用率干到了90%+ 沒源碼怎么排查?
背景介紹
某同學(xué)反映某個(gè)應(yīng)用ECS CPU使用率90%+,希望分析下原因。
該應(yīng)用使用schedulerx來做定時(shí)任務(wù)執(zhí)行,每隔一小時(shí)執(zhí)行一次,每次執(zhí)行5分鐘左右,執(zhí)行任務(wù)期間CPU使用率90%+。
問題現(xiàn)象
圖1 ECS監(jiān)控指標(biāo)
ECS配置是4c8g,從上圖來看系統(tǒng)負(fù)載已經(jīng)非常高了。
分析過程
尋找熱點(diǎn)代碼
arthas profiler比較適用CPU使用率持續(xù)較高的場景。通過對(duì)熱點(diǎn)火焰圖的分析,NoSuchMethodException異常相關(guān)代碼占用了很多CPU時(shí)間。
圖2 熱點(diǎn)火焰圖
上圖紅框中NoSuchMethodException展開后如下圖:
圖2 異?;鹧鎴D
分析異常
ClassUtils
從上圖可以看出org.springframework.util.ClassUtils.getStaticMethod調(diào)用了Class.getMethod,Class.getMethod拋出了NoSuchMethodException,代碼如下。
圖3 ClassUtils.getStaticMethod
為了進(jìn)一步定位問題,需要知道ClassUtils.getStaticMethod方法的入?yún)ⅲ?/span>
圖4 arthas watch
?從上圖看出ClassUtils.getStaticMethod方法入?yún)⒎謩e是:**clazz:java.util.Date;_methodName:_valueOf;args[0]:**java.sql.Timestamp。上面圖片只是截取了一部分,其中methodName還有of、from。
ObjectToObjectConverter
調(diào)用ClassUtils.getStaticMethod的地方是org.springframework.core.convert.support.ObjectToObjectConverter.determineFactoryMethod:?
圖5 ObjectToObjectConverter.determineFactoryMethod
調(diào)用ObjectToObjectConverter.determineFactoryMethod的地方是ObjectToObjectConverter.getValidateMember:
圖6 ObjectToObjectConverter.getValidateMember
雖然java.sql.Timestamp是java.util.Date的子類,但是從上面代碼可以看出進(jìn)行了很多次無效的調(diào)用。
定位業(yè)務(wù)代碼
為了更準(zhǔn)確的定位相關(guān)業(yè)務(wù)代碼,我們需要知道拋出NoSuchMethodException的線程棧,可以使用arthas stack,從線程棧我們可以知道在【哪個(gè)類哪個(gè)方法哪行】發(fā)出的調(diào)用。
stack org.springframework.util.ClassUtils getStaticMethod 'returnObj==null'
圖7 arthas stack
分析業(yè)務(wù)代碼
在我們沒有源代碼的情況,我們可以使用arthas jad反編譯定位到的類,進(jìn)而分析業(yè)務(wù)代碼,到這里就可以具體定位到問題了。
圖8 業(yè)務(wù)代碼
gmt_created、gmt_modified在實(shí)體類中的定義:
圖9 業(yè)務(wù)實(shí)體類
異常場景回顧
查詢數(shù)據(jù)庫,數(shù)據(jù)庫返回ResultSet對(duì)象。
遍歷ResultSet,將ResultSet每一行映射到相應(yīng)的業(yè)務(wù)實(shí)體類實(shí)例化業(yè)務(wù)實(shí)體類,根據(jù)ResultSet.getMetaData()獲取每一列的值并將該值set到實(shí)體類對(duì)應(yīng)屬性上在將gmt_created、gmt_modified解析為java.sql.Timestamp類實(shí)例,接著使用ObjectToObjectConverter將java.sql.Timestamp轉(zhuǎn)換為java.util.Date的時(shí)候拋出了NoSuchMethodException。
異常場景復(fù)現(xiàn)示例代碼:
圖10 測試代碼
圖11 測試代碼
解決辦法
數(shù)據(jù)庫表中g(shù)mt_created、gmt_modified類型與實(shí)體類中對(duì)應(yīng)字段類型的定義保持一致,可以解決異常。
延申閱讀
通過提高BeanPropertyRowMapper相關(guān)邏輯的緩存命中率可以進(jìn)一步優(yōu)化性能,如提前將轉(zhuǎn)換邏輯放到GenericConversionService類的converters中:
圖12 優(yōu)化邏輯
另外可以通過自定義RowMapper來提高性能,因?yàn)锽eanPropertyRowMapper并不是高性能的一種實(shí)現(xiàn):
圖13 BeanPropertyRowMapper