自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="nneo7"><acronym id="nneo7"></acronym></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

FunData — 電競大數(shù)據(jù)系統(tǒng)架構(gòu)演進

作者：肖丁 2018-06-19 17:32:32

無論是對于觀賽用戶，還是比賽用戶，電競數(shù)據(jù)的豐富程度與實時要求得到越來越多的關(guān)注。數(shù)據(jù)對比賽的觀賞性和專業(yè)性的提高也起到至關(guān)重要的作用，相關(guān)背景知識可參考"VARENA開啟電競大數(shù)據(jù)時代"。

FunData作為電競數(shù)據(jù)平臺，v1.0 beta版本主要提供由Valve公司出品的頂級MOBA類游戲DOTA2的相關(guān)數(shù)據(jù)接口(詳情參見open.varena.com)。無論是對于觀賽用戶，還是比賽用戶，電競數(shù)據(jù)的豐富程度與實時要求得到越來越多的關(guān)注。數(shù)據(jù)對比賽的觀賞性和專業(yè)性的提高也起到至關(guān)重要的作用，相關(guān)背景知識可參考"VARENA開啟電競大數(shù)據(jù)時代"。

電競數(shù)據(jù)的豐富性從受眾角度來看，可分為賽事、戰(zhàn)隊和玩家數(shù)據(jù)；從游戲角度來看，維度可由英雄、戰(zhàn)斗、道具以及技能等組成；電競數(shù)據(jù)的實時性包括賽前兩支戰(zhàn)隊的歷史交戰(zhàn)記錄、賽中的實時比分、勝率預(yù)測、賽后比賽分析和英雄對比等。

因此多維度的數(shù)據(jù)支持，TB到PB級別的海量數(shù)據(jù)存儲與實時分析都對底層系統(tǒng)的架構(gòu)設(shè)計有著更高的要求，亦帶來了更嚴峻的挑戰(zhàn)。

本文將介紹FunData的架構(gòu)演進中的設(shè)計思路及其涉及的相關(guān)技術(shù)，包括大數(shù)據(jù)流處理方案、結(jié)構(gòu)化存儲轉(zhuǎn)非結(jié)構(gòu)化存儲方案和數(shù)據(jù)API服務(wù)設(shè)計等。

本文大綱如下：

1.0架構(gòu)

2.0架構(gòu)改造

任務(wù)粒度細化

分布式存儲

系統(tǒng)解耦

數(shù)據(jù)API層

1.0架構(gòu)

2.0架構(gòu)改造

結(jié)語

1.0架構(gòu)

項目發(fā)展初期，依照MVP理論（最小化可行產(chǎn)品），我們迅速推出FunData的第一版系統(tǒng)（架構(gòu)圖如圖1）。系統(tǒng)主要有兩個模塊：Master與Slave。

Master模塊功能如下：

定時調(diào)用Steam接口獲取比賽ID與基礎(chǔ)信息

通過In-Memory的消息隊列分發(fā)比賽分析任務(wù)到Slave節(jié)點

記錄比賽分析進度，并探測各Slave節(jié)點狀態(tài)

Slave模塊功能如下：

監(jiān)聽隊列消息并獲取任務(wù)(任務(wù)主要為錄像分析，錄像分析參考github項目clarity(https://github.com/skadistats/clarity)與manta(https://github.com/dotabuff/manta)）

分析數(shù)據(jù)入庫

系統(tǒng)上線初期運行相對穩(wěn)定，各維度的數(shù)據(jù)都可快速拉取。然而隨著數(shù)據(jù)量的增多，數(shù)據(jù)與系統(tǒng)的可維護性問題卻日益突出。

新增數(shù)據(jù)字段需要重新構(gòu)建DB索引，數(shù)據(jù)表行數(shù)過億構(gòu)建時間太長且造成長時間鎖表。

系統(tǒng)耦合度高，不易于維護，Master節(jié)點的更新重啟后，Slave無重連機制需要全部重啟；同時In-Memory消息隊列有丟消息的風(fēng)險。

系統(tǒng)可擴展性低，Slave節(jié)點擴容時需要頻繁的制作虛擬機鏡像，配置無統(tǒng)一管理，維護成本高。

DB為主從模式且存儲空間有限，導(dǎo)致數(shù)據(jù)API層需要定制邏輯來分庫讀取數(shù)據(jù)做聚合分析。

節(jié)點粒度大，Slave可能承載的多個分析任務(wù)，故障時影響面大。

1.0ETL架構(gòu)圖(圖1)

在開始2.0架構(gòu)設(shè)計與改造前，我們嘗試使用冷存儲方法，通過遷移數(shù)據(jù)的方式來減輕系統(tǒng)壓力（架構(gòu)設(shè)計如圖2）。由于數(shù)據(jù)表數(shù)據(jù)量太大，并發(fā)多個數(shù)據(jù)遷移任務(wù)需要大量時間，清理數(shù)據(jù)的過程同樣會觸發(fā)重新構(gòu)建索引，方案的上線并沒有根本性地解決問題。

冷存儲方案（圖2）

2.0架構(gòu)

吸取1.0系統(tǒng)的經(jīng)驗，在2.0架構(gòu)設(shè)計中，我們從維護性、擴展性和穩(wěn)定性三個方面來考慮新數(shù)據(jù)系統(tǒng)架構(gòu)應(yīng)該具備的基本特性:

數(shù)據(jù)處理任務(wù)粒度細化，且支持高并發(fā)處理( 全球一天DOTA2比賽的場次在120萬場，錄像分析相對耗時，串行處理會導(dǎo)致任務(wù)堆積嚴重)

數(shù)據(jù)分布式存儲

系統(tǒng)解耦，各節(jié)點可優(yōu)雅重啟與更新

架構(gòu)圖如圖3

2.0ETL總架構(gòu)圖（圖3）

2.0系統(tǒng)選擇Google Cloud Platform來構(gòu)建整個數(shù)據(jù)ETL系統(tǒng)，利用PubSub（類似Kafka）作為消息總線，任務(wù)被細化成多個Topic進行監(jiān)聽，由不同的Worker進行處理。這樣一方面減少了不同任務(wù)的耦合度，防止一個任務(wù)處理異常導(dǎo)致其他任務(wù)中斷；另一方面，任務(wù)基于消息總線傳遞，不同的數(shù)據(jù)任務(wù)擴展性變得更好，性能不足時可快速橫向擴展。

任務(wù)粒度細化

從任務(wù)粒度上看(如圖3)，數(shù)據(jù)處理分為基礎(chǔ)數(shù)據(jù)處理與高階數(shù)據(jù)處理兩部分。基礎(chǔ)數(shù)據(jù)，即比賽的詳情信息（KDA、傷害與補刀等數(shù)據(jù)）和錄像分析數(shù)據(jù)（Roshan擊殺數(shù)據(jù)、傷害類型與英雄分路熱力圖等數(shù)據(jù)）由Supervisor獲取Steam數(shù)據(jù)觸發(fā)，經(jīng)過worker的清理后存入Google Bigtable；高階數(shù)據(jù)，即多維度的統(tǒng)計數(shù)據(jù)（如英雄、道具和團戰(zhàn)等數(shù)據(jù)），在錄像分析后觸發(fā)，并通過GCP的Dataflow和自建的分析節(jié)點(worker)聚合，最終存入MongoDB與Google Bigtable。

從Leauge-ETL的細化架構(gòu)看(如圖4)，原有的單個Slave節(jié)點被拆分成4個子模塊，分別是聯(lián)賽數(shù)據(jù)分析模塊、聯(lián)賽錄像分析模塊、分析/挖掘數(shù)據(jù)DB代理模塊和聯(lián)賽分析監(jiān)控模塊。

聯(lián)賽數(shù)據(jù)分析模塊負責(zé)錄像文件的拉取(salt、meta文件與replay文件的獲取)與比賽基本數(shù)據(jù)分析

聯(lián)賽錄像分析模塊負責(zé)比賽錄像解析并將分析后數(shù)據(jù)推送至PubSub

分析/挖掘數(shù)據(jù)DB代理負責(zé)接收錄像分析數(shù)據(jù)并批量寫入Bigtable

聯(lián)賽分析監(jiān)控模塊負責(zé)監(jiān)控各任務(wù)進度情況并實時告警

同時所有的模塊選擇Golang重構(gòu)，利用其“天生”的并發(fā)能力，提高整個系統(tǒng)數(shù)據(jù)挖掘和數(shù)據(jù)處理的性能。

League-ETL架構(gòu)(圖4)

分布式存儲

如上文提到，1.0架構(gòu)中我們使用MySQL存儲大量比賽數(shù)據(jù)及錄像分析數(shù)據(jù)。MySQL在大數(shù)據(jù)高并發(fā)的場景下，整體應(yīng)用的開發(fā)變得越來越復(fù)雜，如無法支持schema經(jīng)常變化，架構(gòu)設(shè)計上需要合理地考慮分庫分表的時機，子庫的數(shù)據(jù)到一定量級時面臨的擴展性問題。

參考Google的Bigtable（詳情見Bigtable: A Distributed Storage System for Structured Data）及Hadoop生態(tài)的HBase(圖5），作為一種分布式的、可伸縮的大數(shù)據(jù)存儲系統(tǒng)，Bigtable與HBase能很好的支持數(shù)據(jù)隨機與實時讀寫訪問，更適合FunData數(shù)據(jù)系統(tǒng)的數(shù)據(jù)量級和復(fù)雜度。

Hadoop生態(tài)(圖5)

在數(shù)據(jù)模型上，Bigtable與HBase通過RowKey、列簇列名及時間戳來定位一塊數(shù)據(jù)(Cell)。(如圖6）

數(shù)據(jù)索引（圖6）

例如，在FunData數(shù)據(jù)系統(tǒng)中，比賽數(shù)據(jù)的RowKey以hash_key+match_id的方式構(gòu)建，因為DOTA2的match_id是順序增大的（數(shù)值自增量不唯一），每個match_id前加入一致性哈希算法算出的hash_key，可以防止在分布式存儲中出現(xiàn)單機熱點的問題，提升整個存儲系統(tǒng)的數(shù)據(jù)負載均衡能力，做到更好的分片(Sharding)，保障后續(xù)DataNode的擴展性。

(如圖7) 我們在hash環(huán)上先預(yù)設(shè)多個key值作為RowKey的前綴，當(dāng)獲取到match_id時，通過一致性哈希算法得到match_id對應(yīng)在hash環(huán)節(jié)點的key值，最后通過key值與match_id拼接構(gòu)建RowKey。

一致性hash構(gòu)建RowKey(圖7)

時間戳的使用方便我們在聚合數(shù)據(jù)時對同一個RowKey和Column的數(shù)據(jù)重復(fù)寫入，HBase/Bigtable內(nèi)部有自定的GC策略，對于過期的時間戳數(shù)據(jù)會做清理，讀取時取最新時間節(jié)點的數(shù)據(jù)即可。

這里大家可能會有個疑問，Bigtable與HBase只能做一級索引，RowKey加上hash_key之后，是無法使用row_range的方式批量讀或者根據(jù)時間為維度進行批量查詢的。在使用Bigtable與HBase的過程中，二級索引需要業(yè)務(wù)上自定義。在實際場景里，我們的worker在處理每個比賽數(shù)據(jù)時，同時會對時間戳-RowKey構(gòu)建一次索引并存入MySQL，當(dāng)需要基于時間批量查詢時，先查詢索引表拉取RowKey的列表，再獲取對應(yīng)的數(shù)據(jù)列表。

在數(shù)據(jù)讀寫上，Bigtable/HBase與MySQL也有很大的不同。一般MySQL使用查詢緩存，schema更新時緩存會失效，另外查詢緩存是依賴全局鎖保護，緩存大量數(shù)據(jù)時，如果查詢緩存失效，會導(dǎo)致表鎖死。

如圖8，以HBase為例，讀取數(shù)據(jù)時，client先通過zookeeper定位到RowKey所在的RegionServer，讀取請求達到RegionServer后，由RegionServer來組織Scan的操作并最終歸并查詢結(jié)果返回數(shù)據(jù)。因為一次查詢操作可能包括多個RegionServer和多個Region，數(shù)據(jù)的查找是并發(fā)執(zhí)行的且HBase的LRUBlockCache，數(shù)據(jù)的查詢不會出現(xiàn)全部鎖死的情況。

HBase架構(gòu)(圖8)

基于新的存儲架構(gòu)，我們的數(shù)據(jù)維度從單局比賽擴展到了玩家、英雄、聯(lián)賽等。（如圖9）

數(shù)據(jù)維度(圖9)

系統(tǒng)解耦

上文我們提到1.0架構(gòu)中使用In-Memory的消息隊列做數(shù)據(jù)傳遞，由于內(nèi)存中隊列數(shù)據(jù)沒有持久化存儲并與Master模塊強耦合，Master節(jié)點更新或者異常Panic后會導(dǎo)致數(shù)據(jù)丟失，且恢復(fù)時間冗長。因此，在2.0架構(gòu)中采用了第三方的消息隊列作為消息總線，保障系統(tǒng)“上下游”節(jié)點解耦，可多次迭代更新，歷史消息變得可追蹤，基于云平臺消息堆積也變得可視化(如圖10)。

數(shù)據(jù)監(jiān)控(圖10)

數(shù)據(jù)API層

1.0系統(tǒng)的數(shù)據(jù)API層為實現(xiàn)快速上線，在架構(gòu)上未做太多的設(shè)計與優(yōu)化，采用域名的方式實現(xiàn)負載均衡，并使用開源的DreamFactory搭建的ORM層，利用其RESTful的接口做數(shù)據(jù)訪問。該架構(gòu)在開發(fā)和使用過程中遇到許多問題：

API層部署在國內(nèi)阿里云上，數(shù)據(jù)訪問需要跨洋

ORM層提供的API獲取表的全字段數(shù)據(jù)，數(shù)據(jù)粒度大

無緩存，應(yīng)對大流量場景(如17年震中杯與ESL)經(jīng)常出現(xiàn)服務(wù)不可用

多DB的數(shù)據(jù)聚合放在了API層，性能不足

服務(wù)更新維護成本高，每次更新需要從域名中先剔除機器

針對上述問題，我們從兩個方面重構(gòu)了1.0數(shù)據(jù)API層。（如圖11）

數(shù)據(jù)API新架構(gòu)（圖11）

鏈路的穩(wěn)定性

全球鏈路上，我們使用CDN動態(tài)加速保證訪問的穩(wěn)定性。同時利用多云廠商CDN做備份容災(zāi)，做到秒級切換。

在調(diào)度能力和恢復(fù)能力上，我們搭建了自己的灰度系統(tǒng)，將不同維度的數(shù)據(jù)請求調(diào)度到不同的數(shù)據(jù)API，減少不同維度數(shù)據(jù)請求量對系統(tǒng)的影響；借助灰度系統(tǒng)，API服務(wù)更新的風(fēng)險和異常時的影響面也被有效控制。依賴云平臺可用區(qū)的特性，灰度系統(tǒng)也能方便地實現(xiàn)后端API服務(wù)跨可用區(qū)，做到物理架構(gòu)上的容災(zāi)。

另外，為保證內(nèi)部跨洋訪問鏈路的穩(wěn)定性，我們在阿里云的北美機房搭建數(shù)據(jù)代理層，利用海外專線來提升訪問速度。

數(shù)據(jù)高可用性

接入分布式存儲系統(tǒng)后，對外數(shù)據(jù)API層也根據(jù)擴展的數(shù)據(jù)維度進行拆分，由多個數(shù)據(jù)API對外提供服務(wù)，例如比賽數(shù)據(jù)和聯(lián)賽賽程等數(shù)據(jù)訪問量大，應(yīng)該與英雄、個人及道具數(shù)據(jù)分開，防止比賽/賽事接口異常影響所有數(shù)據(jù)不可訪問。

針對熱點數(shù)據(jù)，內(nèi)部Cache層會做定時寫入緩存的操作，數(shù)據(jù)的更新也會觸發(fā)Cache的重寫，保障賽事期間的數(shù)據(jù)可用。

結(jié)語

在本篇的技術(shù)分享中，我們介紹了FunData數(shù)據(jù)平臺架構(gòu)演進的過程，分析了舊系統(tǒng)在架構(gòu)上的缺點，以及在新系統(tǒng)中通過什么技術(shù)和架構(gòu)手段來解決。FunData自4月10日上線以來，已有300多位技術(shù)開發(fā)者申請了API-KEY。我們也在著力于新數(shù)據(jù)點的快速迭代開發(fā)，如聯(lián)賽統(tǒng)計數(shù)據(jù)，比賽實時數(shù)據(jù)等。下一篇我們將介紹FunData系統(tǒng)如何基于K8S進行跨云平臺的管理及處理耗資源的計算上，如何利用Serverless服務(wù)/函數(shù)計算提高內(nèi)部系統(tǒng)資源利用率等內(nèi)容。

責(zé)任編輯：何星來源： 51CTO

電競數(shù)據(jù)平臺

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營