榮之聯(lián)DataZoo大數(shù)據(jù)平臺:基于hadoop但不僅僅只是hadoop
近年來,數(shù)據(jù)已經(jīng)成為非常重要的企業(yè)資產(chǎn),通過大數(shù)據(jù)分析改善管理、提升業(yè)務(wù)、促進行業(yè)轉(zhuǎn)型在業(yè)界已達成共識,在此背景下,榮之聯(lián)自主研發(fā)的DataZoo大數(shù)據(jù)平臺應(yīng)運而生。
大數(shù)據(jù)一直是榮之聯(lián)戰(zhàn)略業(yè)務(wù)的重點,榮之聯(lián)執(zhí)行總裁方勇表示,DataZoo大數(shù)據(jù)平臺是面向企業(yè)級市場數(shù)據(jù)服務(wù)業(yè)務(wù)的探索和實踐,可以有效支撐數(shù)據(jù)服務(wù)業(yè)務(wù),加強行業(yè)或?qū)I(yè)領(lǐng)域數(shù)據(jù)應(yīng)用的解決方案能力。據(jù)悉,該平臺還可以根據(jù)不同行業(yè)大數(shù)據(jù)應(yīng)用的特性需求進行定制化展現(xiàn)和數(shù)據(jù)挖掘。
DataZoo這個名字受hadoop生態(tài)以動物命名的啟發(fā),以開源Apache Hadoop為基礎(chǔ)。產(chǎn)品在走開源路線的同時確保企業(yè)級的大規(guī)模使用及平臺與數(shù)據(jù)安全,以降低使用門檻及提升客戶體驗度為目標(biāo)加強產(chǎn)品易用性。DataZoo將hadoop生態(tài)層作為平臺的基礎(chǔ)層,在此之上開發(fā)出五大引擎能力,分別是批處理、實時流處理、多維搜索、圖計算與數(shù)據(jù)挖掘。除此之外,DataZoo提供了數(shù)據(jù)分析生命周期的全方面能力,從數(shù)據(jù)采集清洗轉(zhuǎn)換、數(shù)據(jù)分析與挖掘到數(shù)據(jù)可視化,平臺都有專有的功能產(chǎn)品去支撐。
據(jù)記者了解,榮之聯(lián)自研了很多特色組件多維搜索引擎,技術(shù)上對索引機制進行增強,具有高性能查詢與分析特性,同時集成了豐富的行業(yè)模型,是產(chǎn)品面向行業(yè)的知識庫累積,平臺每被使用一次,其行業(yè)價值就會被累積一次。
運維人員直接通過web頁面監(jiān)控管理集群的運行狀態(tài),應(yīng)用開發(fā)者可以通過界面化操作管理數(shù)據(jù)源、清洗數(shù)據(jù)、分析數(shù)據(jù)與建立模型,大大縮減了應(yīng)用實施的周期,并提高用戶體驗度。基于該平臺,榮之聯(lián)提供端到端的大數(shù)據(jù)解決方案已成功應(yīng)用于公安、證券、交通、新媒體、車聯(lián)網(wǎng)及生物醫(yī)療等多個行業(yè)。