第七批大數(shù)據批處理平臺與分布式分析型數(shù)據庫測試觀察
2018年12月13日,由中國信息通信研究院、中國通信標準化協(xié)會主辦,TC601大數(shù)據技術標準推進委員會承辦的“2018數(shù)據資產管理大會”在京召開。會上,中國通信標準化協(xié)會常務副秘書長代曉慧和中國信息通信研究院黨委副書記喬發(fā)民,共同為通過第七批分布式批處理平臺基礎能力/性能和分析型數(shù)據庫基礎能力/性能測評的15家企業(yè)頒發(fā)證書。
大數(shù)據行業(yè)風向標,測試規(guī)模屢創(chuàng)新高
經過4年的發(fā)展,DCA大數(shù)據產品能力測評,已經成為國內權威的評測體系,成為廠商產品研發(fā)和用戶采購選型的風向標。目前,已進行過的評測中,性能評測的最大測試數(shù)據集達100TB,數(shù)據規(guī)模全球領先;分布式批處理平臺基礎能力測試集群規(guī)模最大達到10000節(jié)點,由阿里云完成;性能測試集群規(guī)模最大達到300節(jié)點,其中華為通過了300個物理機節(jié)點的性能評測,阿里云通過300個云服務節(jié)點的性能評測,新華三通過了200個物理機節(jié)點的性能評測。
評測項目覆蓋廣泛,評測服務可靠權威
同時,分布式批處理平臺基礎能力評測囊括可用性、運維管理、兼容性、功能、安全、多租戶、易用性、擴展性共九大類測試項;分析型數(shù)據庫基礎能力評測囊括功能、運維、安全、擴展性、可用性、兼容性共六大類測試項;分布式批處理平臺性能評測包含SQL負載、NoSQL負載、機器學習三大項;分析型數(shù)據庫性能評測包含SQL負載、混合負載、壓力測試、穩(wěn)定性測試四大項。各品類評測項目覆蓋維度廣泛全面,均為業(yè)內最權威最可靠的專業(yè)評測。
深度觀察評測結果,發(fā)掘差異研判趨勢
在2018年6月到2018年11月期間,國雙科技、航天恒星、騰訊云、南威、新華三、廣州匯智、華宇、中興、浪潮、寶信、數(shù)夢工廠、阿里云、航天信息、達博科技、百度共15家企業(yè)的18個產品參與了第七批分布式批處理平臺基礎能力/性能和分析型數(shù)據庫基礎能力/性能評測。從評測整體情況中能夠得到以下的一些觀察。
在分布式批處理平臺基礎能力方面,產品已經成熟穩(wěn)定,總體來看71%的產品基于HDP和CDH的開源版本進行二次開發(fā),其余基于開源社區(qū)版或者完全自研。與此同時,容器化、支持AI和對大規(guī)模集群的支持是分布式批處理平臺的主要趨勢。在分析型數(shù)據庫基礎能力方面,產品的架構和功能差別較大,其中一種是在開源數(shù)據庫的基礎上進行封裝和二次開發(fā);一種是將SQL引擎嫁接于某種存儲庫之上;此外還有完全自研的產品。而功能的差異點也主要體現(xiàn)在SQL的兼容、運維管理、擴展性等方面。在分布式批處理平臺性能方面,相較上半年的第六批測試基本持平,在SQL測試中最優(yōu)成績和中位數(shù)有小幅下降,HBase測試成績總體接近于上一批。在分析型數(shù)據庫性能方面,國雙科技以優(yōu)異的成績成為本批次唯一通過了MPP性能評測的企業(yè)。
備注:MPP,大規(guī)模并行處理(Massively Parallel Processing),是多個處理器處理同一程序的不同部分時該程序的協(xié)調過程,工作的各處理器運用自身的操作系統(tǒng)和內存。