SREcon:聽云吳靜濤談最好的移動用戶體驗
備受矚目的年度國際***運維專家盛會SREcon今年來到了亞洲,于當?shù)貢r間5月22日-24日在新加坡舉行。SREcon是由計算機科學領域的知名機構(gòu)USENIX主辦,Google、Facebook等硅谷互聯(lián)網(wǎng)巨頭聯(lián)合成立的運維專家會議,每年定期舉行,聚集了關(guān)注網(wǎng)站可靠性、系統(tǒng)工程、以及復雜分布式系統(tǒng)相關(guān)的技術(shù)人員。
以批判性思考、技術(shù)深度剖析、持續(xù)改進以及創(chuàng)新為主旨的SREcon吸引了來自Google、Facebook、Twitter、 LinkedIn、Dropbox、 Netflix、 Pivotal、Pinterest、 Uber、 Twitter等國際知名互聯(lián)網(wǎng)公司的***專家,在現(xiàn)場分享了網(wǎng)站可靠性工程相關(guān)的議題,包含大規(guī)模網(wǎng)站可用性提升、資源優(yōu)化及性能改善等話題。其中,國內(nèi)領先的應用性能管理服務提供商聽云受邀出席了SREcon2017Asia/Australia,技術(shù)副總裁吳靜濤(Fred Wu)在現(xiàn)場與聽眾分享了《Good, Better, Best, Mobile user’sexperience》的話題。
聽云技術(shù)副總裁吳靜濤在場分享
現(xiàn)如今,移動應用更加垂直化、場景化。從辦公、居家再到商業(yè),細化到旅行、運動、消費領域等每一個層面,都直指終端用戶。一款客戶端如何做到復雜但易于使用,強大但不復雜,在這其中用戶體驗變得尤為重要。傳統(tǒng)DC與云監(jiān)控平臺更加關(guān)注高可用性,Restart—Reboot—Reimage是運維工程師***采取的三個動作。在如今的IT環(huán)境中,移動應用更多需要采用第三方監(jiān)控平臺來幫助運維工程師清晰的了解應用運行狀態(tài)與實時用戶體驗,將DC的監(jiān)測范圍擴大到移動用戶,從系統(tǒng)深入到對應用和代碼運行的監(jiān)控,在出現(xiàn)問題的***時間進行定位與追蹤,保障用戶體驗。
以下為演講實錄(中文):
在中國,隨著Z代人逐漸成為市場消費的主力軍,移動互聯(lián)網(wǎng)開始大規(guī)模爆發(fā)并逐漸滲透入這一代人生活中,而Z代人,則是最為注重服務質(zhì)量的一代人。也就是說,在中國的移動互聯(lián)網(wǎng)市場,如何保證用戶的體驗已經(jīng)成為業(yè)務的核心。
[以用戶為中心的第三代平臺正在到來]
借用一個IDC報告,它提出了三個階段的連續(xù)性工業(yè)轉(zhuǎn)型:

***代平臺,即以計算為中心的工業(yè)平臺。
第二代平臺,以應用為中心。現(xiàn)在主流的IT企業(yè)都是以應用為中心的,也就是說,數(shù)據(jù)中心是以應用的可用性為***目標,它是以應用為中心構(gòu)建自己的基礎設施,應用以及運維體系。
第三代平臺,不是以應用為中心,而是以用戶為中心。此時,就產(chǎn)生了非常大的沖突和改變的可能,結(jié)合近年來全球移動互聯(lián)網(wǎng)和云計算的爆發(fā),以這兩者技術(shù)基礎的變更而產(chǎn)生了關(guān)聯(lián)為模型進行相關(guān)闡述,也就是說在未來的三到五年里在非??焖俚娜虻腎T投資里,將會從以應用為中心慢慢轉(zhuǎn)向以用戶為中心。而以用戶為中心,就是用戶的體驗和感受如何。
企業(yè)的第二代平臺往往都是以應用為中心的,從數(shù)據(jù)中心是往外面做,為外面提供服務。而聽云的想法是以用戶為中心,從態(tài)勢感知發(fā)起,向數(shù)據(jù)中心內(nèi)部發(fā)起。這樣就是一個顛覆性的不同點,也是聽云***的核心所在,也是這次聽云參加這次大會希望能夠傳達的全新的理念和技術(shù)解決方案的一個真實的想法和目標。
那么在移動互聯(lián)網(wǎng)大行其道的今天,從手機發(fā)起訪問開始到后端的DB回應為止,中間會涉及到多少個環(huán)節(jié)?答案是成百上千,在這其中有任何一個環(huán)節(jié)出現(xiàn)問題,都會造成用戶體驗下降。
通過下圖我們可以看到,移動終端用戶的80%~90%的時間都花在了前端,也就是說絕大多數(shù)用戶體驗的延遲或者用戶體驗的下降都發(fā)生在前端。而以前所構(gòu)建的所有數(shù)據(jù)中心、基礎架構(gòu)、運維方法全都是以應用可用性為主的,換句話說,很少去關(guān)心用戶端。

那么便會有這樣一個情況發(fā)生:數(shù)據(jù)中心訪問通了,用戶端訪問卻不好,在用戶投訴后,運維人員發(fā)現(xiàn)服務器正常、CPU正常、內(nèi)存正常,加載正常,結(jié)果便是只能籠統(tǒng)地回復客戶正在排查,從而不了了之。
[新一代應用性能管理核心]
國際知名咨詢機構(gòu)Gartner曾規(guī)范過下一代應用性能管理的核心,其認為在未來以云計算+智能終端的云端結(jié)構(gòu)里面,傳統(tǒng)的運維應該慢慢的被拋棄掉,應該去發(fā)展成為一個以應用、用戶體驗為核心的新一代結(jié)構(gòu)。

這里包含了三個主要的組件:
DEM,即用戶體驗的監(jiān)控,包含:
Ø支持對操作體驗和數(shù)字化探針、人和機器的行為優(yōu)化;
Ø與企業(yè)的應用和服務交互;
Ø包括基于網(wǎng)絡和移動端最終用戶的真實用戶監(jiān)控(RUM)和綜合事務監(jiān)控(STM)。
ADTD,即應用組件的深入理解、跟蹤和分析,談的是業(yè)務邏輯的自動拓撲,屬于監(jiān)控的范疇,包含:
Ø了解服務端應用之間的關(guān)系,將事務映射到節(jié)點上,對方法和其他資源進行深度的檢查;
Ø這是一系列的過程,關(guān)注點在問題的修復,且是相互關(guān)聯(lián)的;
Ø包括應用程序拓撲發(fā)現(xiàn)和可視化,用戶定義的事務處理,應用組件的深度鉆取等。
AA,即應用分析,分析不同的語言和不同的系統(tǒng)間如何能夠做跟蹤,包含:
Ø機器學習、統(tǒng)計推斷和其他方法;
Ø自動檢測Java和.NET服務端應用支持的HTTP/S事務的性能異常的來源(或根本原因)
[五步實現(xiàn)NG-APM的全棧溯源,實現(xiàn)***移動用戶體驗]
對于傳統(tǒng)IT系統(tǒng)來說,體系結(jié)構(gòu)設計和基礎設施設計時都會使用一套方法。即系統(tǒng)中有數(shù)據(jù)中心,無論它是虛擬化、云化還是傳統(tǒng)的大機,都會運用網(wǎng)絡運維、數(shù)據(jù)中心運維,并且都是通過客服來了解外部用戶使用體驗。
在過去,傳統(tǒng)企業(yè)往往以可用性為主去構(gòu)建自己的數(shù)據(jù)中心,而在今天則應該走出數(shù)據(jù)中心,把用戶端接進來,把體驗監(jiān)控做進來。在數(shù)據(jù)中心監(jiān)控里面,不應該只監(jiān)控到服務器,應該監(jiān)控到業(yè)務邏輯以及監(jiān)控到代碼運行效率,看到真實用戶的體驗不同。在這樣的大背景下,如何更快的找到性能問題并進行修復呢?

1、EUM,聽云用戶體驗評分系統(tǒng)

2、STM,交互性能分析

3、Network,網(wǎng)絡切片分析

4、Applicationtopology,應用拓撲展示

5、Codereview,代碼偏移量監(jiān)控

[多維度實現(xiàn)新平臺轉(zhuǎn)型]
現(xiàn)在的企業(yè)在轉(zhuǎn)型第三代平臺的過程中,實際上是有可優(yōu)化的方法和路徑的。依照聽云規(guī)范的下一代應用性能管理概念,需要利用一套新的方法去判斷真實的用戶體驗。首先,這就需要先對用戶實施監(jiān)控,出現(xiàn)問題時能夠快速進行判斷和優(yōu)化,這樣才能真的以用戶體驗為先去實施組織內(nèi)部結(jié)構(gòu)。其中,這個結(jié)構(gòu)將會從三個維度組成,分別是Widen、Deepen和Auto。

Widen:
當企業(yè)內(nèi)部結(jié)構(gòu)是以用戶為中心的時候,這一套邏輯方法可以很好的去幫助實現(xiàn)優(yōu)化。它實際上就是規(guī)范的DEM的過程,就是把用戶端的體驗包含在現(xiàn)有的數(shù)據(jù)中心的監(jiān)控范圍之內(nèi),去擴展現(xiàn)有數(shù)據(jù)中心的監(jiān)控廣度。
Deepen:
在廣度加強之后就要加強深度,實際上從深度的角度來講,對于數(shù)據(jù)中心的監(jiān)控應該拋棄以前只監(jiān)控到服務器和TCP端口的方法,需要真正考慮的是任何一個主要的應用過程應該包含有多少個環(huán)節(jié)、每個環(huán)節(jié)之間互相是怎樣的溝通關(guān)系、調(diào)用次數(shù)是多少、現(xiàn)在訪問體驗如何、如果出現(xiàn)了問題快速判斷問題在哪兒等,或者做到代碼級別的監(jiān)控,以加深數(shù)據(jù)監(jiān)控中心的深度。
Auto:
在聽云數(shù)據(jù)中心,每天會有200億條用戶體驗數(shù)據(jù)上傳上來。通過實際訪問的效果、可用性、延遲,甚至是訪問帶寬的價格去判斷應該從哪兒去訪問應用效果是***,成本是***,幫助去做外網(wǎng)用戶的智能路由的管理。
[好、更好、***的移動用戶體驗]
在移動互聯(lián)網(wǎng)時代,當前企業(yè)在構(gòu)建未來的數(shù)據(jù)中心時,應該是以云端結(jié)構(gòu)為基礎。但是在云端結(jié)構(gòu)里面,不能以傳統(tǒng)的方法來進行數(shù)據(jù)中心監(jiān)控。因為傳統(tǒng)的監(jiān)控方法并不能監(jiān)控外部用戶的體驗以及傳輸、代碼、真正的業(yè)務邏輯等。那么當以用戶為中心時,又應該如何去監(jiān)控?移動互聯(lián)網(wǎng)發(fā)展到今天,已經(jīng)給大家提出一個非常大的挑戰(zhàn),這就是如何做下一代的架構(gòu),如何改變現(xiàn)狀。

聽云一直以來都在為客戶提供主動式服務,包括國內(nèi)大事件、電商雙十一的駐場,特別突發(fā)事件的速度判斷,聽云都會提供專家級別的服務。在對于時間的追求上,聽云希望利用從客戶端到后臺全過程追查的全棧溯源的解決方案,能夠幫助傳統(tǒng)銀行業(yè)去打造一個秒極時代的用戶體驗,去應對互聯(lián)網(wǎng),去應對云+智能終端的一個新環(huán)境。