監(jiān)控平臺SkyWalking9入門實踐
一、業(yè)務背景
微服務作為當前系統(tǒng)架構的主流選型,雖然可以應對復雜的業(yè)務場景,但是隨著業(yè)務擴展,微服務架構本身的復雜度也會膨脹,對于一些核心的業(yè)務流程,其請求鏈路會涉及到多個業(yè)務服務,少則三五個,多則十幾個都很常見:
真實的業(yè)務場景遠比圖解復雜,在這種模式下當請求發(fā)生故障時,或者進行優(yōu)化時,需要分析鏈路性能,追蹤調用鏈路,排查和解決鏈路故障;
要完成上述流程,需要對請求的鏈路有完整監(jiān)控,并且采集和分析各個環(huán)節(jié)的數據,這樣才能清晰的理解系統(tǒng)的行為信息,比如耗時分析,故障原因發(fā)現,從而進行優(yōu)化和解決;能實現這種能力的組件很多,這里來看看基于SkyWalking9的實踐方式;
二、組件原理
Skywalking是APM規(guī)范的國產開源分布式鏈路追蹤系統(tǒng),APM(Application-Performance-Management)即應用性能管理,支持對SpringCloud微服務集成,并且無代碼層面的侵入:
結構體系
業(yè)務機制
SpringCloud:分布式系統(tǒng)中的服務,啟動時配置代理即可;
Agent:以探針的方式進行請求鏈路的數據采集,并向管理服務上報;
OAP-Service:接收數據,完成數據的存儲和展示;
Storage:數據的存儲層,支持ElasticSearch、Mysql、H2多種方式;
UI界面:數據的可視化展示界面;
工作流程,服務通過探針的方式接入數據采集的功能,之后請求鏈路的相關處理行為會上報到OAP服務中,進行數據的聚合管理和分析,并存儲在持久層,然后可以通過UI界面進行可視化呈現;
三、安裝部署
1、版本描述
skywalking在之前的舊版本中,apm與agent是在一個包中的,在9.0的版本中是需要分開下載的;agent包下載解壓之后,也將其放到apm包下面維護:
- skywalking-apm-9.1.0.tar.gz
- skywalking-java-agent-8.10.0.tgz
2、配置存儲方式
Skywalking數據存儲的組件有多種選型方式,這里方便本地調試,就選擇MySQL數據庫,在生產環(huán)境中通常選擇ElasticSearch組件;
配置文件:config/application.yml
storage:
selector: ${SW_STORAGE:mysql}
mysql:
properties:
jdbcUrl: ${SW_JDBC_URL:"jdbc:mysql://localhost:3306/swtest?rewriteBatchedStatements=true"}
dataSource.user: ${SW_DATA_SOURCE_USER:username}
dataSource.password: ${SW_DATA_SOURCE_PASSWORD:password}
需要注意的是,要在本地的MySQL中新建swtest數據庫,采用latin1字符編碼,可以避免索引長度的問題,表的創(chuàng)建是自動的,然后需要在包中添加MySQL依賴;
3、啟動與停止
啟動oap服務:sh bin/oapService.sh
啟動UI界面:sh bin/webappService.sh
服務停止命令:jps查看,kill相關編號;
UI界面服務默認是8080端口,如果存在占用問題,可以修改:webapp/webapp.yml?文件,更換端口;啟動完成后訪問LocalIP:port即可;
4、服務集成
在本地存在gateway,facade,account?,三個服務,案例圍繞account服務中的請求展開,由于涉及網關服務,還需要添加相關插件的依賴;
將optional-plugins?可選插件目錄中的兩個網關的依賴包,復制到plugins插件目錄下;
在服務啟動類中添加agent配置,如果在生產環(huán)境中,通常會統(tǒng)一在腳本中設置,由于在本地環(huán)境演示,基于IDEA工具進行管理;
-javaagent:本地路徑/agent/skywalking-agent.jar -Dskywalking.agent.service_name=gateway
-javaagent:本地路徑/agent/skywalking-agent.jar -Dskywalking.agent.service_name=facade
-javaagent:本地路徑/agent/skywalking-agent.jar -Dskywalking.agent.service_name=account
這樣全部的配置就完成了,依次啟動skywalking相關服務,與這里配置的三個微服務,下面再來看看功能細節(jié);
四、功能細節(jié)
1、服務監(jiān)控
相關服務啟動完成后,訪問skywalking界面,主頁加載的即上述配置的三個微服務,這樣說明整個流程是正常的,點擊服務名稱可以查看服務相關的細節(jié)指標;
2、拓補結構圖
請求通過gateway?網關服務,經過facade?門面服務,到達account業(yè)務服務,完成一次調用后,查看請求的拓補結構圖(即Topology一欄);
可以清晰的看到請求的路由鏈路,以及相關服務訪問的數據庫地址,對于微服務架構中的復雜接口來說,借助該拓補模型,既可以快速理解業(yè)務邏輯,同時在出具文檔時可以節(jié)省很多畫圖時間;
3、鏈路跟蹤
上面只是請求的拓補結構圖,在實際應用中還是更側重鏈路跟蹤,查看account服務請求鏈路(即Trace一欄);
skywalking組件對于開發(fā)來說,最常用的就是該功能,這里采集了請求鏈路上的各個節(jié)點,以及執(zhí)行的耗時分析,點擊相關節(jié)點可以查看詳細信息,針對異常請求同樣可以采集到異常信息的描述;
這樣可以極大的提升問題排查的效率,尤其對于那種路由十多個服務的業(yè)務邏輯;
4、數據庫監(jiān)控
雖然在整個配置中沒有顯式的添加對MySQL的監(jiān)控,但是skywalking依舊可以實現對服務中的數據庫監(jiān)控,對于這些指標細節(jié)不過多描述,可以自行查閱文檔;
本篇文章只是站在開發(fā)的角度,總結skywalking的應用方式,并未涉及過多的細節(jié)原理,其它強大的功能設計,對于開發(fā)來說同樣值得參考。
五、源碼參考
應用倉庫: https://gitee.com/cicadasmile/butte-flyer-parent
組件封裝: https://gitee.com/cicadasmile/butte-frame-parent