《王者榮耀》打團(tuán)不掉幀、不卡頓的架構(gòu)方式和實現(xiàn)原理
“農(nóng)藥”自從上線以來,依靠著強(qiáng)大的產(chǎn)品力以及騰訊的運營能力,在游戲市場上的表現(xiàn)可謂是風(fēng)生水起。
根據(jù)第三方的調(diào)研數(shù)據(jù)顯示,《王者榮耀》滲透率達(dá)到 22.3%,用戶規(guī)模達(dá)到 2.01 億人,每日的日活躍用戶(DAU)均值為 5412.8 萬人。 如此可觀的數(shù)據(jù),令人十分欽佩。
當(dāng)然,作為技術(shù)人,更愿意從技術(shù)上去了解一些王者榮耀的實現(xiàn)原理和架構(gòu)方式,從中找到新的知識領(lǐng)域,擴(kuò)展自己的知識邊界,豐富自己的專業(yè)技能。
本文我們將聊一聊王者榮耀的技術(shù)實現(xiàn)以及同步方式,更多的從 MOBA,多人在線戰(zhàn)術(shù)競爭游戲的方向來解析推理王者的實現(xiàn)方案。
以下是主要講解的幾個重點:
- 服務(wù)器架構(gòu)。
- 通信方式。
- 同步方案。
- 技能同步。
- 斷線重連。
服務(wù)器架構(gòu)
不難發(fā)現(xiàn),王者榮耀的服務(wù)器采用房間模式,每個玩家登陸以后,然后進(jìn)入大廳,進(jìn)行游戲匹配。匹配完成之后,把一起對戰(zhàn)的玩家放到一個房間內(nèi)進(jìn)行對戰(zhàn)。
房間類玩法和 MMORPG 有很大的不同,在于其在線廣播單元的不確定性和廣播數(shù)量很小,而且需要匹配一臺房間服務(wù)器讓少數(shù)人進(jìn)入一個服務(wù)器。
這一類游戲最重要的是其“游戲大廳”的承載量,每個“游戲房間”受邏輯所限,需要維持和廣播的玩家數(shù)據(jù)是有限的,但是“游戲大廳”需要維持相當(dāng)高的在線用戶數(shù),所以一般來說,這種游戲還是需要做“分服”的。
而“游戲大廳”里面最有挑戰(zhàn)性的任務(wù),就是“自動匹配”玩家進(jìn)入一個“游戲房間”,這需要對所有在線玩家做搜索和過濾,以及為了更好的體驗,會對玩家進(jìn)行分地區(qū)匹配,以方便獲得更快速的同步。
一般的方式是玩家先登錄“大廳服務(wù)器”,然后選擇組隊游戲的功能,服務(wù)器會通知參與的所有游戲客戶端,新開一條連接到房間服務(wù)器上,這樣所有參與的用戶就能在房間服務(wù)器里進(jìn)行游戲交互了。
通信方式
說到通信方式,一般會有 http 和 socket 兩種方式,但 http 底層也是采用 socket,只是每次通信完成以后都會斷開。
這種方式對于需要頻繁交互的雙方來說,顯得效率太低了,所以一般實時要求高的游戲都是采用 socket 方式來通信。
可是 sokect 通信,又分為兩種:TCP vs UDP,具體是采用那種 socket 類型,需要具體來看游戲游戲類型。
以下是兩種類型的優(yōu)劣:
從上面的對比中,我們會發(fā)現(xiàn),關(guān)于 socket,我們想做的事情,tcp 都幫我們做了,我們只需要建立鏈接,然后像讀寫文件一樣讀寫就可以了。而 udp 需要我們自己設(shè)計一切。
看到這一切,你可能***感覺就是采用 tcp 而非 udp,那么真實情況是如此么?基于游戲的業(yè)務(wù)以及場景不同,我可以明確的告訴你,王者榮耀是采用 udp 的,包括騰訊多數(shù)長鏈接手游都是采用 udp,這是為何?
tcp 保證數(shù)據(jù)可靠性是有代價的
tcp 能夠保證數(shù)據(jù)包的可靠性和有序,這一切都幫你封裝好了。tcp 發(fā)送一個數(shù)據(jù)包,等待一段時間,直到檢測到數(shù)據(jù)包丟失了,如果沒有接收到它的 ACK,接下來就重新發(fā)送丟失的數(shù)據(jù)包到目標(biāo)計算機(jī)。
重復(fù)的數(shù)據(jù)包將被丟棄在接收端,亂序的數(shù)據(jù)包將被重新排序,以此來保證數(shù)據(jù)包的可靠性和有序性。
但為了保證可靠和有序,就要保證 tcp 無論什么情況,只要數(shù)據(jù)包出錯,就必須等待數(shù)據(jù)包的重發(fā)。
這是什么意思呢?就是說,即使***的數(shù)據(jù)已經(jīng)到達(dá),但還是不能訪問這些數(shù)據(jù)包,新到的數(shù)據(jù)會被放在一個隊列中,需要等待丟失的包重新發(fā)過來之后,所有數(shù)據(jù)沒有丟失才可以訪問。
如此,如果遇到網(wǎng)絡(luò)環(huán)境太差或者不穩(wěn)定,比如說國內(nèi)的移動網(wǎng)絡(luò),或者是遭遇到了網(wǎng)絡(luò)阻塞,出現(xiàn)一個數(shù)據(jù)包丟失,所有事情都需要停下來等待這個數(shù)據(jù)包重發(fā)。
客戶端會出現(xiàn)等待接收數(shù)據(jù),玩家操作會出現(xiàn)卡頓以及響應(yīng)不及時的現(xiàn)象。
udp 的可靠性—DIY 手動組裝
從上面我們可以知道 udp 主要在可靠性上是不能保證數(shù)據(jù)包的順序,比如第 100 個收到的數(shù)據(jù)包并不一定是第 100 個發(fā)出的數(shù)據(jù)包,同時也無法保證不丟包,期間有一個包丟失,udp 本身也不會去校檢。
如果這兩個問題解決了,udp 的大部分可靠性問題也就解決了。
具體的方案大體上是這樣來解決:
- 為每個數(shù)據(jù)包增加序列號,每發(fā)一次包,增加本地序號。
- 每個數(shù)據(jù)包增加一段位域,用來容納多個確認(rèn)符。確認(rèn)字符多少個,跟進(jìn)應(yīng)用的發(fā)包速率來決定,速率越高,確認(rèn)字符的數(shù)量也相應(yīng)越多。
- 每次收到包,把收到的包上序列號變?yōu)榇_認(rèn)字符,發(fā)送包的時候帶上這些確認(rèn)字符。
- 如果從確認(rèn)字符里面發(fā)現(xiàn)某個數(shù)據(jù)包有丟失,把它留給應(yīng)用程序來編寫一個包含丟失數(shù)據(jù)的新的數(shù)據(jù)包,必要的話,這個包還會用一個新的序列號發(fā)送。
- 針對多次收到同一包的時候可以放棄它。
同步方案
游戲中常見的同步方案,有狀態(tài)同步和幀同步,一般大型的 MMOARPG 都是采用狀態(tài)同步,比如魔獸世界,狀態(tài)同步采用 C/S 架構(gòu),所有的狀態(tài)由服務(wù)器來控制,安全性比較高,但是流量比較大。
幀同步采用的是囚徒模式,所有 C 端強(qiáng)制采用一個邏輯幀率,從而保證輸出一致,其特點是流量小,安全性比較差。
王者榮耀采用的就是幀同步,那么具體幀同步是什么,如何實現(xiàn)的,我們從兩個地方來分解:
幀率
什么是幀率,可能沒有做過 client 的同學(xué)并不是很清楚這個術(shù)語,我們從一個小例子來講解一下。
我記得小時候有一種小人書,快速翻看就可以看到漫畫上的人物會動起來。
由于人類眼睛的特殊生理結(jié)構(gòu),如果所看畫面之幀率高于每秒約 10-12 幀的時候,就會認(rèn)為是連貫的, 此現(xiàn)象稱之為視覺暫留。
這也就是為什么電影膠片是一格一格拍攝出來,然后快速播放的,就像上圖快速翻小人書一樣。
游戲中的所有動畫也是采用這種方式來渲染,只不過幀率是由 GPU 來控制,你所看到的畫面都是由 GPU 一幀幀渲染的,比如 30幀/s,你所看到的畫面就比較流暢了,而幀率越高你所看到的畫面越流暢。
Lockstep—幀同步
幀同步可以說是通過幀率延伸過來的,你可以把一個游戲看成一個巨大的狀態(tài)機(jī),所有的參與者都采用同一個邏輯幀率來不斷的向前推進(jìn)。
我們看如下 2 個圖:
圖中是 A、B、C 三個玩家的時間軸,這個時間軸不是電腦上的本地時間,而是 A、B、C 聯(lián)機(jī)時定義的一個時間軸。虛線分隔出來的時間片稱為 turn,可以理解成一幀,箭頭表示該玩家將自己的操作指令廣播給其他玩家。
我們把一盤游戲看成一個大型的狀態(tài)機(jī),因為大家玩的是同一款的游戲,因此F是相同的,初始狀態(tài) S0 也是相同的。
在***個 turn 結(jié)束時,所有玩家都接收到了完全一樣的輸入 I,注意這里的 I 不是一個值,而是包含了當(dāng)前游戲中所有玩家的操作指令集合。
t1 時刻所有玩家的電腦自行計算結(jié)果。由于 F、S0 和 I 是固定的,所以每個玩家電腦上計算出的下一個狀態(tài) S1 一定是相同的。
所以通過上面的介紹我們可以知道:
- 我們把游戲的前進(jìn)分為一幀幀,這里的幀和游戲的渲染幀率并不是一個,只是借鑒了幀的概念,自定義的幀,我們稱為 turn。游戲的過程就是每一個 turn 不斷向前推進(jìn),每一個玩家的 turn 推進(jìn)速度一致。
- 每一幀只有當(dāng)服務(wù)器集齊了所有玩家的操作指令,也就是輸入確定了之后,才可以進(jìn)行計算,進(jìn)入下一個 turn,否則就要等待最慢的玩家。之后再廣播給所有的玩家。如此才能保證幀一致。
- Lockstep 的游戲是嚴(yán)格按照 turn 向前推進(jìn)的,如果有人延遲比較高,其他玩家必須等待該玩家跟上之后再繼續(xù)計算,不存在某個玩家領(lǐng)先或落后其他玩家若干個 turn 的情況。使用 Lockstep 同步機(jī)制的游戲中,每個玩家的延遲都等于延遲***的那個人。
- 由于大家的 turn 一致,以及輸入固定,所以每一步所有客戶端的計算結(jié)果都是一致的。
我們來看看具體的執(zhí)行流程:
上圖中我們可以明顯看到,這種囚徒模式的幀同步,在第二幀的時候,因為玩家 1 有延遲,而導(dǎo)致第二幀的同步時間發(fā)生延遲,從而導(dǎo)致所有玩家都在等待,出現(xiàn)卡頓現(xiàn)象。
樂觀鎖&斷線重連
囚徒模式的幀同步,有一個致命的缺陷就是,若聯(lián)網(wǎng)的玩家有一個網(wǎng)速慢了,勢必會影響其他玩家的體驗,因為服務(wù)器要等待所有輸入達(dá)到之后再同步到所有的 C 端。
另外如果中途有人掉線了,游戲就會無法繼續(xù)或者掉線玩家無法重連,因為在嚴(yán)格的幀同步的情況下,中途加入游戲從技術(shù)上來講是非常困難的。
因為你重新進(jìn)來之后,你的初始狀態(tài)和大家不一致,而且你的狀態(tài)信息都是丟失狀態(tài)的,比如你的等級,隨機(jī)種子,角色的屬性信息等。
玩過早期的冰封王座的用戶都知道,一旦掉線基本這局就廢了,需要重開,至于為何沒有卡頓的現(xiàn)象,因為那時解決方案都是采用局域網(wǎng)的方式,所以基本是沒有延遲問題的。
后期為了解決這個問題,如今包括王者榮耀,服務(wù)器會保存玩家當(dāng)場游戲的游戲指令以及狀態(tài)信息,在玩家斷線重連的時候,能夠恢復(fù)到斷線前的狀態(tài)。
不過這個還是無法解決幀同步的問題,因為嚴(yán)格的幀同步,是要等到所有玩家都輸入之后,再去通知廣播 client 更新,如果 A 服務(wù)器一直沒有輸入同步過來,大家是要等著的,那么如何解決這個問題?
采用“定時不等待”的樂觀方式在每次 Interval 時鐘發(fā)生時固定將操作廣播給所有用戶,不依賴具體每個玩家是否有操作更新。
如此幀率的時鐘由服務(wù)器控制,當(dāng)客戶端有操作的時候及時的發(fā)送服務(wù)器,然后服務(wù)端每秒鐘 20-50 次向所有客戶端發(fā)送更新消息,如下圖:
上圖中,我們看到服務(wù)器不會再等到搜集完所有用戶輸入再進(jìn)行下一幀,而是按照固定頻率來同步玩家的輸入信息到每一個 C 端,如果有玩家網(wǎng)絡(luò)延遲,服務(wù)器的幀步進(jìn)是不會等待的。
比如上圖中,在第二幀的時候,玩家 A 的網(wǎng)速慢,那么他這個時候,會被網(wǎng)速快的玩家給秒了(其他游戲也差不多)。
但是網(wǎng)速慢的玩家不會卡到快的玩家,只會感覺自己操作延遲而已。
技能同步
游戲中有很多是和概率相關(guān)的,比如說技能的傷害有一定概率的暴擊傷害或者折光被擊等。
按照幀同步的話,基于相同的輸入,每個玩家的 client 都是獨立計算傷害的,那么如何保證所有電腦的暴擊傷害一致呢?這個時候就需要用到偽隨機(jī)了。
大部分編程語言內(nèi)置庫里的隨機(jī)數(shù)都是利用線性同余發(fā)生器產(chǎn)生的,如果不指定隨機(jī)種子(Random Seed),默認(rèn)以當(dāng)前系統(tǒng)時間戳作為隨機(jī)種子。
一旦指定了隨機(jī)種子,那么產(chǎn)生的隨機(jī)數(shù)序列就是確定的,就是說兩臺電腦采用相同的隨機(jī)種子,第 N 次隨機(jī)的結(jié)果是一致的。
所以在游戲開始前,服務(wù)器為每個玩家分配一個隨機(jī)種子,然后同步給 client,如此每個 client 在計算每個角色的技能時候,就能保證傷害是一致的。這也是多數(shù)幀同步游戲采用的方案,包括王者榮耀。
wier,樂元素 leader 軟件工程師,從 2010 年起從事游戲開發(fā),經(jīng)歷過頁游和手游兩個游戲發(fā)展期,期間曾帶領(lǐng)團(tuán)隊開發(fā)過山寨機(jī)上***款偷菜游戲,如今專注于二次元游戲領(lǐng)域及服務(wù)器技術(shù)研究,運維了一個游戲公眾號“大碼侯”,期待用自己的一點努力和貢獻(xiàn),推進(jìn)游戲社區(qū)的前進(jìn)。