流式計算系統(tǒng)之對比
表1就上述3個流式系統(tǒng)做個分類比較,比較項基于DEBS2011會議上IFPSurvey中涉及的各種Models。Processing Model描述流元組進行計算時的選擇策略、消費策略及負(fù)載降級處理。Interaction Model描述輸入組件和計算系統(tǒng)、計算系統(tǒng)內(nèi)部及計算系統(tǒng)和輸出組件的交互方式。Time Model描述事件流是否按照時間約束。Rules Model描述流式計算規(guī)則是顯示還是隱式。Data Model描述流中的數(shù)據(jù)組成、格式等。Function Model描述流式計算系統(tǒng)的功能模型。Language Model描述語言層面的各種算子。
表1 3種流式系統(tǒng)的模型對比
小結(jié)
本文介紹了業(yè)界主流的3個流式計算系統(tǒng),希望從這些系統(tǒng)的設(shè)計中領(lǐng)悟到不同場景下流式計算所要解決的關(guān)鍵問題。
Yahoo! S4的***版本是Alpha version v0.3.0,動態(tài)負(fù)載均衡和在線服務(wù)遷移等重要功能都尚未實現(xiàn),不過其代表性的3個特點值得學(xué)習(xí),Actor模式、非中心化的對稱結(jié)構(gòu)及可插入式的架構(gòu)。
StreamBase是有著功能強大的IDE并且支持控件式的方法來搭建應(yīng)用程序,同時還提供了高級語言來搭建應(yīng)用程序的方法。由于是商業(yè)產(chǎn)品,其用戶接口的精彩設(shè)計值得借鑒,同時其可組合的HA方案也是亮點之一。
Borealis是學(xué)術(shù)界研究的重要產(chǎn)出,它對新一代的流式系統(tǒng)涉及的諸多方面,如系數(shù)據(jù)模型、負(fù)載管理、高可用性、可擴展性都作了全面和翔實的研究,一方面系統(tǒng)變得強大、先進,另一方面使得系統(tǒng)也變得臃腫、復(fù)雜。這套系統(tǒng)的許多策略都值得我們學(xué)習(xí),可以應(yīng)用于不同的流式計算場景。
【編輯推薦】