徐正君:實(shí)時(shí)流式數(shù)據(jù)處理及應(yīng)用
原創(chuàng)2013年4月26日-27日,由51CTO傳媒集團(tuán)旗下WOT(World Of Tech)品牌主辦的2013大數(shù)據(jù)全球技術(shù)峰會在北京富力萬麗酒店召開。本次峰會將圍繞大數(shù)據(jù)基礎(chǔ)架構(gòu)與上層應(yīng)用的生態(tài)系統(tǒng),解決大規(guī)模數(shù)據(jù)引發(fā)的問題,探索大數(shù)據(jù)基礎(chǔ)的解決方案,激發(fā)數(shù)據(jù)挖掘帶來的競爭力,讓數(shù)據(jù)發(fā)出聲音。51CTO作為本次峰會的主辦方,將全程視頻、圖文直播報(bào)道這場數(shù)據(jù)的盛宴,更多內(nèi)容請點(diǎn)擊專題:2013大數(shù)據(jù)全球技術(shù)峰會。
在26日下午的NoSQL&NewSQL專場論壇中,SAP高級系統(tǒng)架構(gòu)師徐正君發(fā)表了主題為“實(shí)時(shí)流式數(shù)據(jù)處理及應(yīng)用”的演講。徐正君解析了流計(jì)算的定義,并分析了案例。
SAP高級系統(tǒng)架構(gòu)師徐正君
他談到,現(xiàn)在企業(yè)內(nèi)部存在各種各樣的數(shù)據(jù),庫存數(shù)據(jù)、銷售數(shù)據(jù)、交易數(shù)據(jù)、客戶數(shù)據(jù)、移動端數(shù)據(jù)等,這讓業(yè)務(wù)人員想要高效管理大量數(shù)據(jù),得到正確而完整的信息,以及面對問題實(shí)時(shí)獲取答案都非常困難,傳統(tǒng)的數(shù)據(jù)庫很難解決數(shù)據(jù)量和速度的問題,而流計(jì)算或許是解決問題的方式。
傳統(tǒng)的數(shù)據(jù)庫,將所有數(shù)據(jù)存儲起來,計(jì)算時(shí)用SQL語句查詢,流計(jì)算則是讓數(shù)據(jù)流動起來,數(shù)據(jù)從內(nèi)存中流過,截取需要的數(shù)據(jù)。由此得出數(shù)據(jù)流所具備的特征:數(shù)據(jù)連續(xù)不斷;數(shù)據(jù)來源眾多,格式復(fù)雜;數(shù)據(jù)量大,但是不十分關(guān)注存儲;注重?cái)?shù)據(jù)的整體價(jià)值,不要過分關(guān)注個(gè)別數(shù)據(jù);數(shù)據(jù)流順序顛倒,或者不完整。而對應(yīng)的處理工具則需具備高性能、實(shí)時(shí)性、分布式、易用性。
企業(yè)是否選擇流計(jì)算需要自問是否對數(shù)據(jù)的實(shí)時(shí)性有迫切需求,是否更關(guān)注對當(dāng)前數(shù)據(jù)的分析與響應(yīng),是否適用于高吞吐量、低延遲事件流處理的場景。接著徐正君還介紹了常用的開源流計(jì)算產(chǎn)品(Puma、Storm、S4(Simple Scalable Streaming System))、商業(yè)流計(jì)算產(chǎn)品、流計(jì)算的產(chǎn)品架構(gòu)、ESP與DataBase的結(jié)合等。
最后他以比利時(shí)電信和算法交易為實(shí)例,說明流計(jì)算的相關(guān)應(yīng)用方式。
以上是51CTO.com記者從一線為您帶來的精彩報(bào)道。后續(xù)我們還有更加精彩的獨(dú)家報(bào)道,敬請關(guān)注。