亞馬遜大數(shù)據(jù)分析服務(wù)Redshift的優(yōu)與劣
亞馬遜Web服務(wù)(AWS)最近向有限數(shù)量的用戶提供其低價(jià)的大數(shù)據(jù)分析服務(wù)Redshift。你可以把Redshift當(dāng)作滿足大數(shù)據(jù)關(guān)系數(shù)據(jù)庫(kù)需求和旨在支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的一個(gè)公共云服務(wù)。我們預(yù)計(jì)還可以看到這個(gè)云服務(wù)與大數(shù)據(jù)庫(kù)廠商甲骨文展開直接競(jìng)爭(zhēng)。
使用AWS管理控制臺(tái)或者亞馬遜Redshift API,企業(yè)可以配置一個(gè)2TB數(shù)據(jù)庫(kù);作為選擇,企業(yè)可以選擇由16個(gè)2TB超大容量存儲(chǔ)(XL)節(jié)點(diǎn)組成的一個(gè)集群。除了2TB或者16TB存儲(chǔ)容量之外,這些節(jié)點(diǎn)還有15GB內(nèi)存或者120GB內(nèi)存。價(jià)格是XL節(jié)點(diǎn)每小時(shí)85美分,8XL節(jié)點(diǎn)每小時(shí)6.80美元。
同許多其他技術(shù)一樣,你必須考慮Redshift的好的方面和不好的方面。
下面是好的方面:
● 能夠根據(jù)需要配置大型數(shù)據(jù)庫(kù),不必經(jīng)過昂貴的和緩慢的采購(gòu)過程以便獲得硬件和軟件。
● 能夠升級(jí)處理龐大的數(shù)據(jù)庫(kù),也許超過PB容量范圍。
● 有潛力使用一套彈性資源以足夠快的速度返回結(jié)果集。當(dāng)運(yùn)營(yíng)一個(gè)企業(yè)的時(shí)候,這實(shí)際上是很重要的。
● 與使用自己的硬件和軟件的成本相比,這個(gè)服務(wù)有潛力在多年時(shí)間里節(jié)省大量的資金。
不好的方面:
● 可能發(fā)生中斷故障;這不是說企業(yè)的內(nèi)部數(shù)據(jù)倉(cāng)庫(kù)不會(huì)經(jīng)常出現(xiàn)故障,而是說任何故障都將是公開的并且在內(nèi)部給予云計(jì)算一個(gè)打擊。
● 數(shù)據(jù)遷移和集成的成本;你需要大量的帶寬從內(nèi)部系統(tǒng)向云托管的Redshift服務(wù)傳送數(shù)據(jù),或者需要通過FedEx向亞馬遜Web服務(wù)運(yùn)送優(yōu)盤。
● 缺少最佳實(shí)踐:我們剛剛開始應(yīng)用公共云托管的數(shù)據(jù)倉(cāng)庫(kù),顯然還有不少要學(xué)習(xí)的東西。
● 更高成本的可能性;雖然許多機(jī)構(gòu)將發(fā)現(xiàn)使用Redshift等云托管的數(shù)據(jù)庫(kù)會(huì)節(jié)省成本,但是,許多機(jī)構(gòu)將發(fā)現(xiàn)他們的云計(jì)算賬單將遠(yuǎn)遠(yuǎn)高于預(yù)期,也許會(huì)超過內(nèi)部部署的數(shù)據(jù)庫(kù)的成本。
業(yè)內(nèi)人士預(yù)計(jì),就像其他人喜歡的那樣,Redshift將取得成功。然而,在我們開始遷移到這項(xiàng)服務(wù)之前,我們一定要認(rèn)真觀察。我們需要喘口氣和做一些規(guī)劃。