“王者榮耀”高并發(fā)背后的故事
背景
“王者榮耀”是一款國民級手機游戲,用戶體量巨大,而且一直保持著較高的更新頻率。這種業(yè)務場景下,突發(fā)也變得非常頻繁,然而業(yè)務體驗是至關重要的,使用 CDN 必不可少。類似地,經(jīng)常有帶寬突發(fā)的場景,比如新聞爆點視頻、大型直播活動、熱門影視劇上線、熱門游戲等應用發(fā)布。同時,由于家庭帶寬和移動網(wǎng)絡的快速升級,突發(fā)帶寬量級越來越大,經(jīng)常達到 Tb 級,甚至 10Tb 。如何快速、低成本地保障業(yè)務突發(fā),成為 CDN 的一大挑戰(zhàn)。
2007 年,騰訊自建 CDN 啟用,接入了***個業(yè)務騰訊網(wǎng)。到現(xiàn)在 CDN 帶寬量級,從最早的數(shù)十 Gb,發(fā)展到現(xiàn)在的數(shù)十 Tb;單業(yè)務的帶寬也越來越大,大部分業(yè)務常量帶寬在幾百 Gb,部分突發(fā)業(yè)務達到了 10Tb。網(wǎng)絡的快速升級,移動用戶爆發(fā)式增長,以及視頻類業(yè)務包括點播和直播的興起,使得業(yè)務突發(fā)越來越頻繁,突發(fā)帶寬越來越高,對CDN的要求也越來越高。
自建 CDN 得益于騰訊業(yè)務的蓬勃發(fā)展,先后支持了游戲下載、流媒體視頻加速、春節(jié)紅包等騰訊內(nèi)部業(yè)務;2014 年騰訊將 CDN 全面能力開放,成為 騰訊云 CDN 產(chǎn)品,除承載內(nèi)部業(yè)務外,也開始接入第三方客戶,比如快手點播、斗魚直播等。以上各種業(yè)務都有突發(fā)場景,也有很強的成本訴求,在如何低成本地保障業(yè)務突發(fā),騰訊 CDN 積累了豐富的經(jīng)驗。接下來就挑戰(zhàn)和問題、解決方案、效果三個方面來解析。
一、挑戰(zhàn)和問題
下面將從業(yè)務特點開始,分析目前存在的挑戰(zhàn)和問題。
1、 業(yè)務特點和挑戰(zhàn)
CDN 多樣化的場景,注定了突發(fā)業(yè)務充滿挑戰(zhàn)。突發(fā)業(yè)務具有體量大、場景多樣化、 無規(guī)律等特點。
- 體量大:突發(fā)業(yè)務帶寬大部分都超過 Tb,部分甚至達到了 10T ;
- 場景多樣化:點播中的熱劇和新聞爆點;直播中的 LOL/KPL/DOTA2 等游戲直播,NBA/世界杯等體育直播,演唱會等綜藝直播;應用下載中的王者榮耀等游戲下載;靜態(tài)網(wǎng)頁加速中的紅包活動、電商促銷等;
- 無規(guī)律:部分突發(fā)活動無法預知,活動快要開始或已經(jīng)開始了才知道,比如新聞爆點。
體量大,需要準備更多的資源;場景多樣化,需要滿足不同的資源需求;無規(guī)律性則對我們的擴容效率提了很高的要求。
2、 目前存在的問題
僅僅為了滿足業(yè)務突發(fā)需求而儲備大量的資源,成本太高,會造成資源極大的浪費。所以一般會通過復用資源來應對業(yè)務突發(fā)。但是直接復用資源,存在兩個問題:
- 只能復用部分資源:CDN 業(yè)務,一般按業(yè)務類型來區(qū)分平臺和資源使用,主要原因是不同業(yè)務類型對資源需求不同,比如點播類需要更多的存儲;有較多 https 請求的靜態(tài)頁面類,則需要更多 CPU 資源。這種限制使得資源無法充分利用,加大了資源準備的難度。比如視頻突發(fā)主要使用視頻 Buffer,而下載類和網(wǎng)頁類 Buffer 無法直接使用,這限制了 Buffer 的大小。即使復用同類型資源,因為涉及多個業(yè)務資源的協(xié)調(diào),準備時間一般會超過兩天,無法應對臨時突發(fā);
- 無法降低成本:另外針對部分突發(fā)業(yè)務,比如游戲應用下載,帶寬高峰期在上午和中午,如果只使用本平臺資源,會導致結算帶寬明顯上漲,從而增加成本。無法利用同其他業(yè)務錯峰的特點來降低結算帶寬。
二、解決方案
騰訊云 CDN 通過虛擬化復用現(xiàn)有資源,搭建全業(yè)務通用的突發(fā)池,所有平臺共享 Buffer。 突發(fā)池中的設備為 Docker 虛擬機,虛擬機有不同的規(guī)格,只要業(yè)務有需求,都可以按需使用。突發(fā)池中的帶寬儲備達到了 10Tb,基本能滿足所有業(yè)務突發(fā)需求 。任何業(yè)務有突發(fā)需求,配合自動化上架接口,可在 10 分鐘完成 10Tb 突發(fā)池的擴容。
1、 突發(fā)池系統(tǒng)架構
突發(fā)池系統(tǒng)架構見圖 1
圖 1 突發(fā)池系統(tǒng)架構
- 突發(fā)池:在各平臺物理機的上層,由 Docker 虛擬機組成的資源池,對 CPU/內(nèi)存/磁盤等使用進行了限制,防止對物理機造成影響。原有業(yè)務依然部署在物理機上,不用調(diào)整。
- 自動化部署和監(jiān)控系統(tǒng): 能根據(jù)業(yè)務實際需求,自動預測需求并擴容 。所有的突發(fā)需求,都能在 10 分鐘內(nèi)擴容完成。針對點播/下載業(yè)務,自動分發(fā)熱點文件,降低回源帶寬。
- 調(diào)度系統(tǒng):突發(fā)業(yè)務的突發(fā)性和體量大兩個特點,使得相比域名調(diào)度系統(tǒng),直通車更占優(yōu)勢。直通車調(diào)度更靈活,生效時間快,能達到分鐘級。
虛擬機和物理機部署了上報 Agent,業(yè)務信息和服務器負載每分鐘都會上報到監(jiān)控系統(tǒng)。監(jiān)控系統(tǒng)會根據(jù)歷史帶寬預測一個值,并與當前帶寬比較,如果當前帶寬超過預測值的 50%,則認為有突發(fā)。根據(jù)帶寬上漲的比例,系統(tǒng)會自動從突發(fā)池中擴容相應數(shù)據(jù)的設備。針對提前準備的突發(fā)活動,運維可以指定帶寬需求量,之后系統(tǒng)便會自動計算設備需求并擴容。
分鐘粒度上報的服務器負載信息則為監(jiān)控系統(tǒng)做調(diào)度決策提供了依據(jù)。系統(tǒng)會依據(jù)機房剩余帶寬、服務器帶寬、CPU、IO 等綜合信息決定虛擬機是否需要從直通車中啟用或者禁用。用戶訪問時先請求直通車調(diào)度系統(tǒng),直通車會根據(jù)調(diào)度策略返回一個 302 地址,302 地址中為實際 CDN 資源地址。用戶跳轉到 302 地址,并獲取實際內(nèi)容。
2、技術優(yōu)化
使用虛擬化技術復用資源的重要前提是,不影響現(xiàn)有業(yè)務。這就要求對資源有充分的隔離,比如 CPU/磁盤,以及對帶寬的使用。下面是實現(xiàn)過程中存在的幾個問題及解決方案:
精準控制單機負載:負載過高會影響業(yè)務質(zhì)量,需要對單機負載進行精準的控制。
解決方案:
- 配額系統(tǒng):直通車中有配額系統(tǒng),對每個虛擬機可使用的資源做了限制,包括CPU/IO 和帶寬。監(jiān)控系統(tǒng)中上報的信息,結合配額系統(tǒng),可以確保服務器負載被限定在制定的范圍內(nèi),粒度為分鐘級。
- 部分請求返回 302:對 CPU/帶寬/IO 等做了限制后,應用程序能根據(jù)母機當前負載,實時判斷是否處理一個請求。如果負載在限制范圍內(nèi),直接處理;如果負載超出限制,則返回 302,使用戶跳轉到直通車的調(diào)度地址,這樣能在盡量不影響業(yè)務質(zhì)量的情況對負載做精準控制。程序?qū)用鎸ω撦d的實時控制,是配額系統(tǒng)的有效補充。
- 網(wǎng)卡流量控制:在極端情況下,業(yè)務帶寬超過設定閾值,這時虛擬網(wǎng)卡會主動丟包,避免對母機造成影響。
限制磁盤大?。篋ocker 在 ext3/ext4 文件系統(tǒng)中無法對文件/目錄級別進行磁盤大小限制。
解決方案:
- 由于騰訊云 CDN 業(yè)務基本都是使用 ext3/ext4 文件系統(tǒng),這種情況下 Docker 只能對根據(jù)用戶或用戶組對磁盤進行限制,但現(xiàn)網(wǎng)業(yè)務都是直接在 root 環(huán)境下使用。這里我們使用 loop device 來解決磁盤大小限制問題。虛擬機中突發(fā)業(yè)務使用掛載在 loop device 上的目錄,這樣就可以間接限制磁盤大小,防止使用太多磁盤影響其他業(yè)務。
CPU綁定:默認是綁定所有 CPU,部分單 CPU 負載高會影響母機業(yè)務。
解決方案:
- 通過腳本每分鐘采集一次系統(tǒng)所有單CPU負載,為避免頻繁調(diào)整和受毛刺數(shù)據(jù)影響,取15分鐘的均值。***選取負載較低的部分核,并通過配置文件cpuset.cpus來動態(tài)綁定,將虛擬機對母機業(yè)務影響降低到最小,并且能充分利用資源。
效果
突發(fā)池上線后,高效支持了王者榮耀下載、NBA 直播、KPL/LPL 游戲直播等多次大型突發(fā)活動,節(jié)約成本 2000萬。通過共享 buffer,搭建突發(fā)池能顯著提高突發(fā)能力和降低成本。
總結
騰訊云 CDN 通過 Docker 技術復用資源,搭建 Tb 級別突發(fā)池,能支持直播、點播、靜態(tài)等各種業(yè)務突發(fā),能自動檢測到業(yè)務突發(fā)需求并在 10 分鐘內(nèi)完成資源擴容,具有發(fā)布快,成本低等特點。資源復用能提高資源利用率,為業(yè)務提供極大的突發(fā)池,但要注意復用業(yè)務之間不能相互影響,這需要對服務器進行實時的監(jiān)控和及時的調(diào)度。
另外還有一些待改進的地方,比如內(nèi)核參數(shù)基于容器隔離,方便不同業(yè)務調(diào)優(yōu);部分業(yè)務客戶端不支持 302 跳轉,調(diào)度系統(tǒng)需要支持域名調(diào)度方式。