聽(tīng)云雙十一重保服務(wù) 為應(yīng)用性能帶來(lái)實(shí)時(shí)監(jiān)控保護(hù)
原創(chuàng)【51CTO.com原創(chuàng)稿件】 臨近雙十一,所有的電商網(wǎng)站都在緊鑼密鼓的籌備和宣傳,對(duì)于雙十一當(dāng)天自家網(wǎng)絡(luò)承載能力的預(yù)估,也成了電商公司技術(shù)部門最為棘手的問(wèn)題。日前,擁有11年應(yīng)用性能管理經(jīng)驗(yàn)的APM廠商-聽(tīng)云在公司總部召開(kāi)媒體溝通會(huì),與來(lái)訪的媒體代表深入交流了雙十一期間,聽(tīng)云推出的重保服務(wù)方案。51CTO有幸到場(chǎng)聆聽(tīng)了聽(tīng)云技術(shù)支持總監(jiān)谷岳靜女士的講解和演示,了解到雙十一當(dāng)天,確保網(wǎng)絡(luò)系統(tǒng)順暢運(yùn)行的"秘密"。
雙十一電商面臨的挑戰(zhàn)
谷岳靜向媒體表示,雙十一電商網(wǎng)站面臨的挑戰(zhàn)非常大,每一家電商在雙十一都會(huì)面臨非常大的流量峰值,在這一天的流量峰值我們是想象不到的,要提前預(yù)估在那天有多少的流量,提前做多少帶寬的冗余,多少服務(wù)器的冗余來(lái)保障雙十一的需求。
另一個(gè)挑戰(zhàn)是最近幾年,基本上用戶都會(huì)轉(zhuǎn)到移動(dòng)端上面來(lái),比如京東,有60%~70%的用戶在移動(dòng)端上,聚美幾乎有90%的用戶都是移動(dòng)端。所以說(shuō)最近幾年,對(duì)這些用戶來(lái)說(shuō),一個(gè)很大的挑戰(zhàn)是終端設(shè)備的復(fù)雜以及網(wǎng)絡(luò)接入方式的復(fù)雜。以前就是移動(dòng)電信聯(lián)通這些,但是現(xiàn)在就有了3G、4G和各種各樣的介入方式,接入方式越多,對(duì)于后端技術(shù)的不可控程度也就越高。終端設(shè)備方面,近年來(lái)移動(dòng)端的發(fā)展,僅安卓在全球的獨(dú)立機(jī)型就有五萬(wàn)多種,對(duì)于他們來(lái)說(shuō)要了解每一個(gè)用戶的使用習(xí)慣是一個(gè)非常大的挑戰(zhàn)。
第三點(diǎn)是交易額高,京東雙十一或者618當(dāng)天的銷售額可能會(huì)相當(dāng)于他們往常一個(gè)月甚至兩個(gè)月的銷售額。另外用戶體驗(yàn)對(duì)于銷售額的影響也是非常大的,比如說(shuō)網(wǎng)站如果斷了一秒,就這一秒就可以造成幾百萬(wàn)甚至上千萬(wàn)的損失,所以說(shuō)就在活動(dòng)當(dāng)天,他們對(duì)于用戶體驗(yàn)的要求是非常高的。
第四點(diǎn)數(shù)字化轉(zhuǎn)換營(yíng)銷成功率的壓力非常大,臨近雙十一,我們?cè)诘罔F、App等等各種媒體渠道上都可以看到非常多的電商網(wǎng)站在打廣告,那么這個(gè)廣告能不能成功的轉(zhuǎn)化對(duì)于技術(shù)人員的壓力也是非常大的一個(gè)點(diǎn)。
電商技術(shù)部門的四點(diǎn)訴求
"針對(duì)于上述的挑戰(zhàn),技術(shù)部門也會(huì)有一些訴求。"谷岳靜告訴大家。
***個(gè)訴求是在大促前進(jìn)行現(xiàn)網(wǎng)環(huán)境的壓力測(cè)試,一般情況下都是做一些內(nèi)網(wǎng)環(huán)境下的壓測(cè),但是內(nèi)網(wǎng)環(huán)境下的測(cè)試只是模擬請(qǐng)求。現(xiàn)網(wǎng)環(huán)境就是真實(shí)用戶的測(cè)試,通過(guò)真實(shí)的測(cè)試來(lái)預(yù)估服務(wù)器的擴(kuò)容。
第二個(gè)訴求,現(xiàn)在需要一套終端用戶時(shí)時(shí)監(jiān)控系統(tǒng),用來(lái)監(jiān)視用戶端的,因?yàn)榧夹g(shù)部門一開(kāi)始只是針對(duì)服務(wù)器監(jiān)控,但是這遠(yuǎn)遠(yuǎn)不夠。因?yàn)橛袛?shù)據(jù)指出,在性能問(wèn)題中有70%的問(wèn)題來(lái)自于用戶端,服務(wù)器端的問(wèn)題只占大約30%。比如用戶點(diǎn)擊App的一個(gè)按鈕無(wú)響應(yīng),通常情況下這是無(wú)法反映到服務(wù)器中去的,現(xiàn)在就需要有一套用戶端的監(jiān)控系統(tǒng)。
第三個(gè)訴求:用戶需要一套工具,即出現(xiàn)問(wèn)題時(shí),可以有一套工具來(lái)快速告訴我們問(wèn)題點(diǎn)出現(xiàn)在哪里,并由誰(shuí)來(lái)解決,讓這一套工具來(lái)很好的界定影響范圍。
第四個(gè)訴求,說(shuō)到大促就不得不提CDN,因?yàn)樵诖蟠俚倪^(guò)程中,每一家電商自己機(jī)房的帶寬肯定是滿足不了需求的,一定需要CDN來(lái)幫助自己做帶寬上的補(bǔ)充。CDN是一個(gè)黑盒式的服務(wù),對(duì)于用戶來(lái)說(shuō),要想知道用戶端的用戶體驗(yàn)好不好,就一定要監(jiān)控到第三方服務(wù)商,也就是CDN廠商的每一個(gè)節(jié)點(diǎn)是不是在正常運(yùn)作,因?yàn)镃DN上的每一個(gè)節(jié)點(diǎn)出問(wèn)題,都會(huì)影響到用戶所在地的一個(gè)省或者周邊省份的訪問(wèn)情況。所以對(duì)于技術(shù)部門來(lái)說(shuō),需要一套工具來(lái)把CDN的質(zhì)量透明化,把CDN每一個(gè)節(jié)點(diǎn)的數(shù)據(jù)都量化出來(lái),這樣哪里有問(wèn)題就可以快速的找CDN去解決。
聽(tīng)云工作人員在大屏幕上實(shí)時(shí)監(jiān)控用戶流量情況
聽(tīng)云重保服務(wù)為雙十一保駕護(hù)航
對(duì)于每一個(gè)電商企業(yè)的技術(shù)部門來(lái)說(shuō),雙十一當(dāng)天***的訴求是:可以沒(méi)有驚喜,但絕對(duì)不能出事。萬(wàn)一有緊急情況發(fā)生,就要快速定位問(wèn)題根源,因?yàn)槊恳环昼姷挠绊懚际菐装偃f(wàn)的損失。另外當(dāng)發(fā)現(xiàn)問(wèn)題的時(shí)候就要精準(zhǔn)的定位這個(gè)問(wèn)題是由研發(fā)解決、運(yùn)維來(lái)解決或是第三方來(lái)解決。這就是防出事并如何快速定位解決問(wèn)題。
保障方案方面,聽(tīng)云根據(jù)訴求,幫助電商企業(yè)做到防出事,幫他做快速的定位,當(dāng)出現(xiàn)問(wèn)題的時(shí)候就要他協(xié)調(diào)以達(dá)到快速解決的目的,最終減少對(duì)用戶、對(duì)品牌的影響。在雙十一當(dāng)天,聽(tīng)云會(huì)根據(jù)客戶的要求,提供技術(shù)人員駐場(chǎng)服務(wù)。聽(tīng)云會(huì)將客戶的業(yè)務(wù)數(shù)據(jù)實(shí)時(shí)展現(xiàn)在大屏中,直觀的反饋網(wǎng)絡(luò)的承載情況。
怎么做到防出事,聽(tīng)云首先會(huì)給客戶提供一套以用戶為中心的保障方案,最開(kāi)始的時(shí)候電商企業(yè)的監(jiān)控,都是從數(shù)據(jù)中心內(nèi)部出發(fā)來(lái)監(jiān)控??赡軘?shù)據(jù)中心內(nèi)部的安全性能達(dá)到很高的分值,但是用戶卻還在投訴。所以現(xiàn)在越來(lái)越多的電商企業(yè)開(kāi)始關(guān)注用戶端的數(shù)據(jù),我們把整個(gè)方案分成用戶端、網(wǎng)絡(luò)層和后端。
用戶端方面,針對(duì)于APP,聽(tīng)云是讓客戶在APP中集成一條SDK,從而獲取所有的真實(shí)用戶訪問(wèn)體驗(yàn)數(shù)據(jù),比如說(shuō)訪問(wèn)卡頓,點(diǎn)擊時(shí)轉(zhuǎn)圈或閃退等等,App端的數(shù)據(jù)我們是通過(guò)這種方式采集的。針對(duì)于瀏覽器端,我們是在客戶的頁(yè)面中插入JS,來(lái)獲取最近一段時(shí)間用戶訪問(wèn)頁(yè)面的次數(shù)、哪個(gè)頁(yè)面首屏的白屏很長(zhǎng)等等,針對(duì)于這些數(shù)據(jù)來(lái)進(jìn)行針對(duì)性優(yōu)化。
網(wǎng)絡(luò)層方面,聽(tīng)云在全國(guó)有30萬(wàn)個(gè)真實(shí)網(wǎng)民,讓這些網(wǎng)民模擬其用戶進(jìn)行訪問(wèn)從而獲得撥測(cè)訪問(wèn)的性能數(shù)據(jù);到了數(shù)據(jù)中心內(nèi)部,也就是后端,聽(tīng)云通過(guò)在應(yīng)用服務(wù)器上部署探針的方式來(lái)獲取每一行代碼的執(zhí)行效率,以及其服務(wù)器硬件的數(shù)據(jù)。所以說(shuō)聽(tīng)云為用戶提供了一套以用戶為中心的解決方案,將用戶的數(shù)據(jù)按業(yè)務(wù)維度全部建立起來(lái),當(dāng)出問(wèn)題的時(shí)候,在這一整套平臺(tái)中可以實(shí)現(xiàn)端到端的溯源,比如前端有個(gè)接口很慢,聽(tīng)云可以通過(guò)前瞻分析,用上百種指標(biāo)來(lái)供客戶詳細(xì)分析錯(cuò)誤原因以及責(zé)任界定。
第二個(gè)防出事的方法是,聽(tīng)云幫助電商企業(yè)做現(xiàn)網(wǎng)環(huán)境的壓測(cè),做到真實(shí)用戶的端到端的壓測(cè)方案。具體怎么實(shí)現(xiàn)呢?聽(tīng)云在全國(guó)有30萬(wàn)的真實(shí)網(wǎng)民,調(diào)用這些網(wǎng)民用戶來(lái)實(shí)時(shí)的對(duì)服務(wù)器發(fā)起并發(fā)訪問(wèn),在后端上部署探針,從而可以看到當(dāng)大流量過(guò)來(lái)的時(shí)候其后端代碼執(zhí)行效率的變化,看瓶頸點(diǎn)在哪里,再進(jìn)行針對(duì)性的優(yōu)化。這里舉個(gè)例子,比如在網(wǎng)上買東西,流程是打開(kāi)頁(yè)面,搜索,到商品頁(yè)出來(lái)很多的商品列表,加入購(gòu)物車,登錄,訂單支付…大概是這樣的一個(gè)流程,聽(tīng)云會(huì)針對(duì)于這類的業(yè)務(wù)流程來(lái)進(jìn)行監(jiān)測(cè),比如一開(kāi)始的時(shí)候先是100個(gè)用戶訪問(wèn)過(guò)來(lái),之后沒(méi)過(guò)5分鐘就增加100個(gè)用戶,隨著時(shí)間的推移,用戶量則會(huì)越來(lái)越大,從而看出瓶頸點(diǎn)是在哪里。
大促當(dāng)天,聽(tīng)云要把客戶所有關(guān)鍵的業(yè)務(wù)接口全部監(jiān)控起來(lái),比如加入購(gòu)物車按鈕、產(chǎn)品分類、搜索、登錄等等,將這些全部梳理出來(lái),變被動(dòng)為主動(dòng),按照業(yè)務(wù)維度進(jìn)行監(jiān)控。以前的監(jiān)控都是從數(shù)據(jù)中心內(nèi)部發(fā)起的監(jiān)控,比如我某一個(gè)服務(wù)器的CPU高了,服務(wù)器的磁盤滿了,都是這類的維度。但是這些原因用戶是感知不到的,用戶能感知到的就是點(diǎn)擊這個(gè)按鈕不管用,又或者某個(gè)頁(yè)面打不開(kāi)了,這才是用戶能夠理解的語(yǔ)言。所以說(shuō)我們做的事情,就是按照業(yè)務(wù)維度進(jìn)行報(bào)警,從而更快的知道錯(cuò)誤點(diǎn)在哪,從而變被動(dòng)為主動(dòng)。
雙十一對(duì)于電商之重,重如泰山。聽(tīng)云在APM領(lǐng)域的經(jīng)驗(yàn)告訴我們,只有提前現(xiàn)網(wǎng)壓測(cè),當(dāng)天實(shí)時(shí)監(jiān)控,才能切實(shí)為用戶企業(yè)保駕護(hù)航。在雙十一的驚人數(shù)字背后,無(wú)不滲透著電商技術(shù)部門和第三方技術(shù)部門的良苦心血,讓我們共同期待2017雙十一的到來(lái),期待著電商網(wǎng)絡(luò)為我們的生活帶來(lái)更多的便利和驚喜。就讓聽(tīng)云為電商網(wǎng)絡(luò)的驚喜保駕護(hù)航吧!
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】