云端部署大數(shù)據(jù)解決方案該用IaaS還是PaaS?
譯文【51CTO.com快譯】通過快速部署、很低的資本成本和可擴(kuò)展性,云計算給公司企業(yè)了巨大的價值。
然而,選擇IaaS解決方案還是PaaS解決方案對云項目的回報速度以及應(yīng)用程序開發(fā)創(chuàng)造價值的時間會有重大影響。
將大數(shù)據(jù)解決方案部署到云端時,一個早期的討論點和常見的架構(gòu)決定就是選擇IaaS解決方案,還是選擇PaaS解決方案。大多數(shù)大型云服務(wù)提供商同時提供高度專業(yè)化的PaaS功能和比較靈活的IaaS功能,讓架構(gòu)師可以選擇合理兼顧功能、成本、速度和可擴(kuò)展性等方面的部分。
大數(shù)據(jù)市場的IaaS解決方案據(jù)往往是通常部署在企業(yè)內(nèi)部本地的技術(shù),但部署在云服務(wù)提供商的環(huán)境里面的虛擬機中。像Hadoop、Cassandra和MongoDB這些技術(shù)常常部署在公共云上,采用了類似本地部署環(huán)境的架構(gòu)。
PaaS解決方案為廣大用戶提供了一系列功能,這些功能常常通過一套標(biāo)準(zhǔn)的API加以顯露,這些API可通過編程予以利用,以便迅速開發(fā)和部署應(yīng)用程序。AWS的常見PaaS解決方案包括:面向數(shù)據(jù)倉庫的Redshift和面向NoSQL數(shù)據(jù)庫服務(wù)的DynamoDB。谷歌在提供PaaS功能時,還提供Bigtable(鍵/值存儲系統(tǒng))和BigQuery(具有高度擴(kuò)展性的數(shù)據(jù)分析引擎,支持類似SQL的大型數(shù)據(jù)集查詢)。
雖然每種解決方案各有獨特的優(yōu)勢,但實際采用會不一樣,取決于具體的運營需求和技術(shù)特性要求。IaaS和PaaS方面需要權(quán)衡的一些常見因素如下:
IaaS
- 讓部署的云能夠酷似用于本地大數(shù)據(jù)解決方案的技術(shù)架構(gòu)。
- 讓基于云的架構(gòu)與提供商認(rèn)證計劃和***應(yīng)用程序框架的聯(lián)系更加緊密。
- 讓應(yīng)用程序和工作負(fù)載在云服務(wù)提供商之間更加易于移植。
- 能夠考慮一系列更廣泛的云,包括提供更為傳統(tǒng)的主機托管服務(wù)的提供商。
- 需要一系列更廣泛的技能,包括系統(tǒng)管理和運營。
- 通常根據(jù)相對計算和存儲資源的每小時費用來進(jìn)行定價。
PaaS
- 通過對服務(wù)消費使用一種編程方法,可以更迅速地實現(xiàn)價值。
- 通過完善PaaS功能來獲得成熟的可擴(kuò)展性:先作為云提供商的內(nèi)部技術(shù),然后作為PaaS功能提供給外面的用戶。
- 定價模式通?;谶w移的數(shù)據(jù)量或者是針對特定API的請求數(shù)。
在云端構(gòu)建大數(shù)據(jù)解決方案時,你在考慮IaaS和PaaS功能以確定哪個更適合你具體的使用場合和工作負(fù)載時,有幾個關(guān)鍵的問題需要評估:
- 技能組合評估――PaaS解決方案需要較低的運營開銷和較少的系統(tǒng)級技能,但確實需要開發(fā)人員有相應(yīng)經(jīng)驗,并且熟悉用來調(diào)用PaaS解決方案的特定API和方法。
- 應(yīng)用程序支持――許多大數(shù)據(jù)部署環(huán)境在充分利用商業(yè)化工具用于可視化和預(yù)測分析,這類工具往往需要數(shù)據(jù)平臺(比如PaaS和IaaS部署所用的那些平臺)方面有相應(yīng)認(rèn)證。你應(yīng)該評估所有PaaS解決方案,確保API符合將來被集成的額外工具的要求。
- 成本模式――IaaS和PaaS之間的成本模式全然不同。PaaS系統(tǒng)將基于使用情況,所以預(yù)料不到的負(fù)載會對成本產(chǎn)生意料之外的影響,而IaaS基于可用計算容量,所以可能存在這種情況:為環(huán)境配置過多的資源,為未使用的資源花冤枉錢。
就構(gòu)建大數(shù)據(jù)平臺而言,云計算提供了靈活的選擇方案:可以迅速部署的PaaS解決方案,以及靈活、易于移植的IaaS解決方案。貴企業(yè)應(yīng)該從核心需求和技術(shù)要求入手,確定哪條道路最適合自己。
原文:Deploying Big Data Solutions in the Cloud – Use IaaS or PaaS?
【51CTO.com獨家譯稿,合作站點轉(zhuǎn)載請注明來源】