華為云發(fā)布立體運維解決方案,為企業(yè)關(guān)鍵業(yè)務(wù)保駕護航
越來越多的企業(yè)選擇將關(guān)鍵業(yè)務(wù)部署上云后,希望有一站式的運維工具保障業(yè)務(wù)的持續(xù)穩(wěn)定運行。除了能監(jiān)控各種基礎(chǔ)資源消耗和應(yīng)用健康狀態(tài)外,還希望能感知各地域真實用戶體驗RUM(Real User Management), 能深入了解業(yè)務(wù)所依賴的基礎(chǔ)服務(wù)、中間件和第三方服務(wù)對業(yè)務(wù)的影響;當(dāng)業(yè)務(wù)性能下降或者異常,如客戶投訴在線支付老失敗時,企業(yè)希望有工具能協(xié)助運維人員快速診斷問題,找到問題根因,甚至在影響到業(yè)務(wù)交易之前提前預(yù)警。針對這些典型的企業(yè)訴求,華為云推出了立體運維解決方案AOM。
華為云推出的立體運維提供真正“立體”的全方位能力,包括齊全的數(shù)據(jù)種類、端到端跨層全鏈路分析和豐富的數(shù)據(jù)洞察能力。下圖是立體運維的模型示意圖。
垂直采集數(shù)據(jù),齊全的數(shù)據(jù)種類是華為云立體運維的基礎(chǔ)。
華為云立體運維數(shù)據(jù)包括四大類數(shù)據(jù),分別是指標(biāo)(Metrics),日志(Logs),調(diào)用鏈(Traces)和各種事件告警(Events)。
- 指標(biāo)數(shù)據(jù)(metrics):既有IaaS層資源指標(biāo),也有PaaS層應(yīng)用資源指標(biāo),客戶所用云服務(wù)業(yè)務(wù)指標(biāo)、客戶業(yè)務(wù)自定義指標(biāo)(由客戶根據(jù)自身需求主動上報)。
- 日志數(shù)據(jù)(logs):客戶指定的業(yè)務(wù)和各種中間件的運行日志
- 調(diào)用鏈數(shù)據(jù)(traces):客戶通過非侵入式方法獲得的調(diào)用鏈數(shù)據(jù),典型的場景就是用戶應(yīng)用是采用Java開發(fā)的。如果業(yè)務(wù)應(yīng)用是其他開發(fā)語言開發(fā)的,那么只需要在代碼中引入SDK或者直接按照標(biāo)準(zhǔn)格式上報調(diào)用鏈數(shù)據(jù)即可接入平臺。
- 事件及告警(events&alerts):客戶應(yīng)用主動上報的各種事件和直接告警信息,還有根據(jù)預(yù)定義規(guī)則產(chǎn)生的事件和告警。
- 網(wǎng)絡(luò)包數(shù)據(jù)(packets):主要是虛擬網(wǎng)絡(luò)、容器網(wǎng)絡(luò)中面向應(yīng)用的網(wǎng)絡(luò)性能數(shù)據(jù)。這一類數(shù)據(jù)一般都被指標(biāo)metrics所涵蓋,不過也有一種發(fā)展趨勢:主張packets數(shù)據(jù)獨立出來為一大類,那么就衍生成五種數(shù)據(jù)源,本質(zhì)上是一樣的。所以立體運維的***個維度就是數(shù)據(jù)來源的全覆蓋。
水平分析能力,提供端到端(E2E:end to end)的跨層全鏈路分析是華為云立體運維基本能力。
當(dāng)云應(yīng)用的物理或邏輯資源規(guī)模擴大、應(yīng)用技術(shù)棧的多樣化、應(yīng)用架構(gòu)的容器化、微服務(wù)化后,運維的復(fù)雜度是非線性增長的,業(yè)務(wù)復(fù)雜些的企業(yè)應(yīng)用甚至還是多AZ、跨DC的。因此帶來的巨大挑戰(zhàn)就是對用戶體驗管理(RUM)和業(yè)務(wù)可用性(Availability)越來越不可知性。這是大大有別于傳統(tǒng)計算環(huán)境(On-premise)運維經(jīng)驗。為了解決這個問題,華為云AOM支持從最終用戶的Mobile端、Browser端,跨過網(wǎng)絡(luò)到云服務(wù)端(backend),而云服務(wù)端,AOM支持對應(yīng)用及其基礎(chǔ)資源的分層感知,包括業(yè)務(wù)應(yīng)用層(SaaS層)、中間件服務(wù)層(比如內(nèi)部服務(wù)、外部第三方服務(wù)或者消息通道、緩存等中間件)、以容器為代表的PaaS層和IaaS基礎(chǔ)設(shè)施層。
事實上AOM把很多指標(biāo)數(shù)據(jù)中的一些維度屬性和IaaS、PaaS層的基礎(chǔ)部署信息結(jié)合起來,形成面向應(yīng)用的元數(shù)據(jù)集(內(nèi)部稱之為Inventory),和傳統(tǒng)的CMDB有些類似,但粒度更細(xì)。Inventory的目的就是為面向應(yīng)用的數(shù)據(jù)分析提供各種可能的“關(guān)系網(wǎng)”。不管是基于Java的非嵌入式采集性能數(shù)據(jù),還是基于Agent+插件的性能數(shù)據(jù)自動采集,又或者基于SDK或者REST API方式上報性能數(shù)據(jù),AOM都能在上述各個層面中做到事務(wù)(transaction,比如加入購物車這個動作)級甚至深入到函數(shù)方法級別的調(diào)用關(guān)系追蹤。加上在虛擬容器網(wǎng)絡(luò)方面的優(yōu)勢,AOM真正做到了E2E的全鏈路性能管理。
分析洞察能力,提供多元化的技術(shù)分析手段和功能智能化,是華為立體運維面向人工智能時代的升級。
應(yīng)用運維面臨的場景復(fù)雜,沒有***的“炮彈彈”,因此華為云運維精心打造 “十八般武器”,提供多種功能特性。為什么AIOps對IT運維如此重要呢?一方面是機器的全局觀優(yōu)于人類。盡管人類局部認(rèn)知可以很深入,但在復(fù)雜的場景中,尤其是各種可能組合數(shù)量遠(yuǎn)遠(yuǎn)超越了人力所能企及的范圍,要掌握全局是有很大困難的。其次運維中某些場景對時效性要求非常高(比如秒級監(jiān)控、故障自愈),比如基于指標(biāo)、日志、事件的告警;根據(jù)監(jiān)測指標(biāo)、服務(wù)模型、規(guī)則和算法智能地及時自適當(dāng)調(diào)整(典型的有云服務(wù)的彈性伸縮)。因此,除了傳統(tǒng)的各種數(shù)據(jù)源分析之外,華為云還推出了基于AI技術(shù)的智能異常檢測和事務(wù)洞察。
華為云立體運維AOM,協(xié)助企業(yè)減輕傳統(tǒng)運維的壓力,為企業(yè)關(guān)鍵業(yè)務(wù)保駕護航,讓運維不再困難。華為云立體運維AOM:https://www.huaweicloud.com/product/aom.html
HUAWEI CONNECT 2018作為華為自辦的面向ICT產(chǎn)業(yè)的全球性年度旗艦大會,將于2018年10月10日-12日在上海隆重舉行。本屆大會以“+智能,見未來”為主題,旨在搭建一個開放、合作、共享的平臺,與客戶伙伴一起共同探討如何把握新機遇創(chuàng)造智能未來。欲了解更多詳情,請參閱:
https://www.huawei.com/cn/press-events/events/huaweiconnect2018