詳解Amazon Redshift
11月底,AWS推出了數(shù)據(jù)倉庫服務(wù)Redshift,除了價(jià)格便宜,Redshift還有諸多特點(diǎn),甚至你根本不需要雇傭數(shù)據(jù)庫管理員。以下為James Hamilton對Redshift的評論:

快速 強(qiáng)大——Redshift有大量創(chuàng)新,提供非常高的數(shù)據(jù)請求性能,支持從幾百GB到PB或更多。首先,它采用列式存儲和壓縮技術(shù)。第二,硬件對數(shù)據(jù)倉庫進(jìn)行優(yōu)化,使用附加的本地存儲和萬兆網(wǎng)卡連接每個(gè)節(jié)點(diǎn)。最后,使用了大規(guī)模并行處理(MPP)架構(gòu),可以在不停機(jī)的情況下實(shí)現(xiàn)擴(kuò)展或收縮。
擴(kuò)展性——有兩種節(jié)點(diǎn)類型可選,一種為特大節(jié)點(diǎn)(XL),擁有2TB的壓縮存儲空間,另一種為8倍特大節(jié)點(diǎn)(8XL),擁有16TB壓縮存儲空間。起初,你可以從1個(gè)特大節(jié)點(diǎn)起步,最大擴(kuò)展到總共100個(gè)8倍特大節(jié)點(diǎn)的集群。特大節(jié)點(diǎn)集群可擁有1到32個(gè)節(jié)點(diǎn),8倍特大集群可以擁有2到100個(gè)節(jié)點(diǎn)。
通過AWS管理控制臺或API,可以輕松的調(diào)整節(jié)點(diǎn)數(shù)量,并且這一過程不需要停機(jī)。目前Redshift處在有限預(yù)覽階段,并不支持調(diào)整重新設(shè)定空間,正式版將提供這一功能。
高性價(jià)比——你可以選擇按需付費(fèi)或長期合同,或通過保留實(shí)例獲得更低的價(jià)格。在按需付費(fèi)方式下,2TB的數(shù)據(jù)倉庫的價(jià)格為0.85美元/小時(shí),價(jià)格節(jié)點(diǎn)數(shù)量隨擴(kuò)展線性增長。保留實(shí)例的價(jià)格為0.228美元/小時(shí),折合每年1000美元/TB。
全方位管理——Redshift對所有的設(shè)置、運(yùn)維、擴(kuò)展進(jìn)行管理,貫穿數(shù)據(jù)倉庫從建立到集群備份,以及安裝補(bǔ)丁或升級。所有這些耗費(fèi)精力的操作都交由Amazon來處理。
安全——Redshift支持SSL加密,可通過網(wǎng)頁界面對訪問數(shù)據(jù)倉庫網(wǎng)絡(luò)的防火墻進(jìn)行設(shè)置,并支持在數(shù)據(jù)倉庫集群中創(chuàng)建用戶。當(dāng)Redshift正式發(fā)布后,計(jì)劃支持靜止數(shù)據(jù)加密(encrypting data at rest)和Amazon虛擬私有云(Amazon VPC)。
可靠性——所有寫入節(jié)點(diǎn)的數(shù)據(jù),都將自動(dòng)的在集群內(nèi)的節(jié)點(diǎn)進(jìn)行備份,并不間斷的在S3進(jìn)行備份。Redshift對集群的健康持續(xù)關(guān)注,并自動(dòng)替換任何組件。
兼容性——Redshift通過了JasperSoft和Microstrategy認(rèn)證,可以使用PostgreSQL JBDBC或ODBC將SQL客戶端或智能工具與Redshift數(shù)據(jù)倉庫連接。
寫在最后
毫無疑問,對于價(jià)格敏感的用戶,Redshift的吸引力足夠強(qiáng)大。但我還是會問許多問題?數(shù)據(jù)安全如何保證?S3僅能提供99.9%的可用性,與金融行業(yè)的標(biāo)準(zhǔn)相去甚遠(yuǎn)。今年和去年頻發(fā)的宕機(jī),讓許多AWS用戶心有余悸。有些充滿智慧的用戶摸索出一套跨可用區(qū)備份的經(jīng)驗(yàn),能大大提高可用性,但這需要幾年時(shí)間進(jìn)行摸索、試錯(cuò)和優(yōu)化。對于計(jì)劃嘗鮮Redshift的用戶,首先需要在本地保存好數(shù)據(jù),并準(zhǔn)備一只強(qiáng)大的運(yùn)維隊(duì)伍以及足夠的寬容心。