Amazon Redshift簡介
隨著各種云端服務(wù)的涌現(xiàn),數(shù)據(jù)倉庫領(lǐng)域近些年發(fā)生了劇烈變化,因?yàn)樵贫朔?wù)可以實(shí)現(xiàn)極高的性能、簡單的部署、近乎無限的可擴(kuò)展性和輕松的管理方式,而成本只有內(nèi)部解決方案的一小部分。因此,企業(yè)很快都在將其數(shù)據(jù)倉庫從內(nèi)部遷移到云中。AWS 提供全套服務(wù),可實(shí)施從數(shù)據(jù)收集和存儲到處理和可視化在內(nèi)的整個數(shù)據(jù)倉庫工作流程。
Amazon Redshift 是一種快速且完全托管的數(shù)據(jù)倉庫,讓您可以使用標(biāo)準(zhǔn) SQL 和現(xiàn)有的商業(yè)智能 (BI) 工具經(jīng)濟(jì)高效地輕松分析您的所有數(shù)據(jù)。利用 Amazon Redshift,您可以使用高性能本地磁盤上的列式存儲通過復(fù)雜的查詢優(yōu)化對 PB 級結(jié)構(gòu)化數(shù)據(jù)運(yùn)行復(fù)雜的分析查詢,并能大規(guī)模執(zhí)行并行查詢。大多數(shù)結(jié)果在幾秒內(nèi)返回。使用 Amazon Redshift 時,您可以從小規(guī)模開始,費(fèi)用只有每小時 0.25 USD,并且無需承諾;然后將數(shù)據(jù)量擴(kuò)展到 PB 級,費(fèi)用為每年每 TB 1000 USD,不到傳統(tǒng)解決方案的十分之一。
Amazon Redshift 還包含 Redshift Spectrum,讓您可以對 Amazon S3 中的 EB 級非結(jié)構(gòu)化數(shù)據(jù)直接運(yùn)行 SQL 查詢。不需要加載或轉(zhuǎn)換,并且您可以使用 Avro、CSV、Grok、Ion、JSON、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile 和 TSV 等開源數(shù)據(jù)格式。Redshift Spectrum 可以根據(jù)檢索的數(shù)據(jù)自動擴(kuò)展查詢計算容量,因此對 Amazon S3 的查詢速度非???,不受數(shù)據(jù)集大小的影響。
優(yōu)勢
1、快速
Amazon Redshift 使用列存儲技術(shù)來改善 I/O 效率并能跨過多個節(jié)點(diǎn)并行查詢,可以實(shí)現(xiàn)快速查詢。數(shù)據(jù)加載的速度隨著集群的大小線性擴(kuò)展;能夠與 Amazon S3、Amazon DynamoDB、Amazon EMR、Amazon Kinesis 和任何啟用 SSH 的主機(jī)集成。
2、價格低廉
您只需按實(shí)際使用量付費(fèi)。每年每 TB 1000 USD 即可讓不限數(shù)量的用戶對您的所有數(shù)據(jù)進(jìn)行不限次數(shù)的分析,成本只有傳統(tǒng)數(shù)據(jù)倉庫解決方案的十分之一。大多數(shù)客戶的數(shù)據(jù)大小在壓縮之后減小到原來的三分之一到四分之一,每年每 TB 未壓縮數(shù)據(jù)的成本降低到 250 – 333 USD。
3、可擴(kuò)展
Redshift Spectrum 讓您可以利用現(xiàn)在使用的 SQL 語法和 BI 工具,對 Amazon S3 中的 EB 級數(shù)據(jù)進(jìn)行查詢,就像在 Amazon Redshift 本地磁盤中存儲的 PB 級數(shù)據(jù)運(yùn)行查詢一樣簡單。您可以將高度結(jié)構(gòu)化并且頻繁訪問的數(shù)據(jù)存儲在 Redshift 本地磁盤中,并將大量非結(jié)構(gòu)化數(shù)據(jù)存儲在 Amazon S3“數(shù)據(jù)湖”中,然后在二者范圍內(nèi)進(jìn)行無縫查詢。
4、簡單
借助 Amazon Redshift,您可以輕松自動執(zhí)行大多數(shù)常規(guī)管理任務(wù),以管理、監(jiān)控和擴(kuò)展數(shù)據(jù)倉庫。通過處理所有這些耗時耗力的任務(wù),Amazon Redshift 使您得到了解脫并專注于您的數(shù)據(jù)和業(yè)務(wù)。
5、可擴(kuò)展
只需在控制臺中單擊幾下或使用簡單的 API 調(diào)用,即可根據(jù)性能和容量需求的更改來輕松擴(kuò)展和縮小集群。
6、安全
安全件是內(nèi)置的。您可以使用硬件加速型 AES-256 和 SSL 加密靜態(tài)和動態(tài)數(shù)據(jù),使用 Amazon VPC 隔離您的集群,甚至使用 AWS Key Management Service (KMS) 和硬件安全模塊 (HSM) 管理您的密鑰。
7、兼容
Amazon Redshift 支持標(biāo)準(zhǔn) SQL 并提供自定義 JDBC 和 ODBC 驅(qū)動程序 (您可從控制臺下載這些驅(qū)動程序),從而使您能夠使用各種常見的 SQL 客戶端。您也可以使用標(biāo)準(zhǔn)的 PostgreSQL JDBC 和 ODBC 驅(qū)動程序。