深入淺出科技運營指標體系
引言
提起科技運營指標,每個科技人都能說出幾個,比如交易量、響應時間、響應率、成功率等。這些指標都是對運營工作中某個領域工作的量化評估。但是,要評估科技運營的整體水平,就必須建立科技運營的指標體系,獲取全局性信息,進而通過這些信息去驅動運營工作的發(fā)展,達成組織目標。
建設目標及定位
G行建立科技運營可觀測性指標體系,為管理人員提供多維度、精細化的運營管理分析框架,并以此為抓手,提升中心運營管理能力、決策水平和服務質量。指標體系建設遵循可量化、可對比、具備行動導向、多場景適配四個原則,聚焦實際業(yè)務場景,支持不同層級的應用。
設計思路
指標體系的設計基于OSM + UJM + 應用場景。OSM模型(Obejective,Strategy,Measurement)分別代表目標、策略、度量。UJM模型(User Journey Map),對應運維旅程地圖。通過OSM使業(yè)務目標結構化,然后融合UJM和運維場景。
以下為OSM層級結構:
OSM層級結構
OSM與UJM模型結合,就是將UJM模型中用戶體驗作為重要參考指標。通過科技運營指標監(jiān)測,了解系統(tǒng)和服務的穩(wěn)定性、性能和安全性,從而更好的支持和提升用戶體驗。按照用戶體驗、容量管理、安全性、服務支持等思路梳理流程如下。
指標體系能力矩陣
由于目標和視角各不相同,需要多套指標體系共同指導科技運營工作,G行目前也已形成“橫向管理”、“縱向運維”兩大指標體系框架,下面分別展開說明。
基于橫向管理指標體系框架
橫向運營管理體系中,頂層圍繞保安全、提效率、論效益、優(yōu)服務的工作目標,在策略層面從資源管理、資源交付、服務支持、運行保障、安全管控五個運營管理活動要素上進行拆解到具體指標。
基于縱向運維指標體系框架
縱向運維管理以應用為核心,從業(yè)務端出發(fā),按照IT系統(tǒng)自上而下調用依賴關系,分為五層技術指標:應用層、網絡層、資源層、中間件層、數據庫層。最終構建了一套具備總覽應用系統(tǒng)健康度,形成立體化分析的指標體系。
如某重要渠道系統(tǒng)日交易量近期高于峰值,且CPU、內存等利用率偏高,就要及時跟進業(yè)務運營狀態(tài),并考慮資源擴容等問題。
指標體系應用實踐
下面介紹G行科技運營橫向管理的指標體系建設實踐。
資源管理
在資源管理方面,通過對資源精細化控制,提升資源管理效率。主要從數據中心運維規(guī)模、資源利用率、數字化能力等方面入手。運維規(guī)模指標主要要包括機房規(guī)模、設備數量、軟件數量、云資源、運維人員數量等;資源利用率指標包括機房使用效率、設備資源利用率、云資源利用率;數字化能力指標是指以數據要素作為數字經濟時代的核心資產,通過接入、使用、質量合規(guī)等方面對運維數據資產持續(xù)運營管理。
資源交付
在資源交付方面,從運維過程中所需要的硬件和軟件資源考量,將這些資源的交付能力以數字化形式體現(xiàn),實現(xiàn)資源交付快速、準確、可靠的能力管理。
服務支持
在服務支持方面,從運維過程中變更、投產、問題等角度出發(fā),通過數字化指標反映應用系統(tǒng)相關服務支持情況,實現(xiàn)數據中心服務支持能力的高效管理。
運行保障
在運行保障方面,從科技運營過程中相關保障工作考慮,將監(jiān)控、災備、批量運行、事件和可用性方面指標通過數字化形式體現(xiàn),實現(xiàn)業(yè)務系統(tǒng)的運行保障工作穩(wěn)定和可靠管理。
安全管控
在安全管控方面,從科技運營安全合規(guī)、應急等方面考慮,將安全管控能力相關的指標數據體現(xiàn)出來,使得數據中心安全運營的管理和控制能力滿足內外部環(huán)境要求。
總結
科技運營指標體系沒有最優(yōu)解,而是企業(yè)根據自身發(fā)展階段、戰(zhàn)略規(guī)劃、目標受眾、業(yè)務流程等因素設計并持續(xù)迭代的;好的指標體系能夠幫助我們找到改善業(yè)務的操作、管理和戰(zhàn)略,圍繞組織目標,驅動各層級采取對應的行動。
G行將持續(xù)以科技運營數據平臺為依托,在指標分層分級應用基礎上,以提升投入產出精細化管理能力、服務業(yè)務發(fā)展為目標,通過統(tǒng)一的平臺、統(tǒng)一的指標體系,推動運維數據資源共享與整合,營造開放式數據生態(tài),實現(xiàn)運營數據的資產沉淀。