5分鐘搞定 AlertManager 接入短信、語(yǔ)音等10+種通知渠道
SLS告警管理
AlertManager作為Prometheus生態(tài)系統(tǒng)的一員,提供了包括靜默、抑制、通知在內(nèi)的多種告警管理服務(wù)。同時(shí)AlertManager在實(shí)際使用中還存在著或多或少的不足,例如通知渠道過(guò)少,規(guī)則配置過(guò)程繁瑣。
阿里云日志服務(wù)為了解決告警的通知、管理等問(wèn)題,推出了日志服務(wù)告警中心,為客戶(hù)提供了一站式的告警解決方案。下圖中的功能對(duì)比給出了SLS告警和AlertManager+Prometheus生態(tài)的功能對(duì)比,可以看出SLS告警提供了企業(yè)級(jí)的服務(wù),能夠極大的方便用戶(hù)的工作。
SLS開(kāi)放告警
SLS告警提供的開(kāi)放告警功能,能夠很方便的將三方系統(tǒng)的告警消息接入到SLS告警中心,而且不需要對(duì)現(xiàn)有系統(tǒng)做任何改造。AlertManager接入SLS告警后的告警消息流如下圖所示:
下面介紹將AlertManager接入到SLS告警的詳細(xì)流程,包括SLS告警配置和AlertManager配置兩部分。
SLS告警配置
1. 創(chuàng)建行動(dòng)策略
行動(dòng)策略將決定了SLS在接收Alert Manager告警消息后,以何種方式及何種渠道通知您。為此,您需要首先打開(kāi)告警中心,點(diǎn)擊告警管理,在下拉菜單中選擇行動(dòng)策略:
然后點(diǎn)擊頁(yè)面左上角的添加按鈕,在彈出的對(duì)話(huà)框中配置新的行動(dòng)策略,然后點(diǎn)擊確認(rèn)。目前,系統(tǒng)支持語(yǔ)音,短信,郵箱,釘釘和企業(yè)微信等通知渠道,有關(guān)行動(dòng)策略的具體配置方法,可參閱官方文檔創(chuàng)建行動(dòng)策略。
2. 創(chuàng)建開(kāi)放告警服務(wù)
首先打開(kāi)告警中心,點(diǎn)擊告警管理,在下拉菜單中選擇開(kāi)放告警:
點(diǎn)擊頁(yè)面左上角的創(chuàng)建按鈕,在彈出的對(duì)話(huà)框中配置新的開(kāi)放告警服務(wù),包括服務(wù)ID和服務(wù)名稱(chēng),然后點(diǎn)擊保存:
3. 創(chuàng)建開(kāi)放告警應(yīng)用
選擇上一步驟中創(chuàng)建的服務(wù),在操作欄中點(diǎn)擊該服務(wù)的應(yīng)用按鈕:
在彈出的對(duì)話(huà)框中點(diǎn)擊創(chuàng)建,添加新的應(yīng)用,點(diǎn)擊保存。這里的協(xié)議請(qǐng)選擇AlertManager,行動(dòng)策略選擇在第一步中配置的策略,其余選項(xiàng)可選擇默認(rèn)值。
4. 獲取開(kāi)放告警應(yīng)用接口
現(xiàn)在,您在第二步創(chuàng)建的開(kāi)放告警服務(wù)中已經(jīng)存在一個(gè)新的告警應(yīng)用了。點(diǎn)擊該應(yīng)用操作欄的接口按鈕,獲取接口信息:
接口地址由兩部分構(gòu)成:
域名部分:SLS的接入地址,和地域相關(guān),每個(gè)地域都有各自不同的接入地址;
子路徑部分:包括用于發(fā)送消息的Access Key Id和開(kāi)放告警應(yīng)用Id。需要注意的是,用戶(hù)需要將子路徑部分中的{ACCESS_KEY_ID}替換為具體阿里云RAM賬戶(hù)的Access Key Id,并且將權(quán)限策略AliyunLogOpenEventWrite賦予該賬戶(hù)。
Alert Manager接入配置
在Alert Manager配置文件中,您首先需要?jiǎng)?chuàng)建一個(gè)告警消息的接收者。為此,您需要在receivers配置項(xiàng)下添加一個(gè)Webhook接收者,在url字段中填寫(xiě)上一步驟中獲取的接口地址。然后,您需要在route配置項(xiàng)下添加前面創(chuàng)建的接收者。典型的配置文件如下圖所示:
route:
receiver: '{RECIEVER_NAME}'
...
...
receivers:
- name: '{RECIEVER_NAME}'
webhook_configs:
- url:
- 'http://{ALIYUN_SLS_ENDPOINT}/event/webhook/RAMAK_{ACCESS_KEY_ID}/{WEBHOOK_APP_ID}'
- name: ...
其中{RECIVER_NAME}為用戶(hù)為接收者自定義的名稱(chēng)。
效果展示
告警消息查看
在告警中心的事務(wù)視圖界面,可以查看接收到的告警消息列表,以及該告警消息的詳情。
告警接入概覽
在開(kāi)放告警大盤(pán),可以查看告警消息過(guò)濾、發(fā)送情況。
告警通知概覽
告警大盤(pán)展示了所有告警消息的概覽視圖,可以查看通過(guò)不同通知渠道發(fā)送的消息量。