更多新特性,HPE Vertica8.0榮耀問(wèn)世!
從零售業(yè)、銀行業(yè),到通信業(yè)、制造業(yè),甚至公共部門,HPE Vertica憑借對(duì)數(shù)據(jù)的強(qiáng)大存儲(chǔ)和處理能力,已經(jīng)充分滿足了各行各業(yè)的獨(dú)特需求。作為為大數(shù)據(jù)量身打造的實(shí)時(shí)分析平臺(tái),它不僅創(chuàng)造了更快的分析速度,連接了更多的數(shù)據(jù)源,同時(shí)也加快了更多企業(yè)的業(yè)務(wù)轉(zhuǎn)型。
不過(guò),HPE Vertica的持續(xù)創(chuàng)新之路并不止于此。Vertica8.0現(xiàn)已榮耀問(wèn)世,一起來(lái)看看它到底增添了哪些新特性,又將如何助力你我未來(lái)的新征程!
1.數(shù)據(jù)管理
在表級(jí)數(shù)據(jù)加載策略上,它可以不修改ETL和BI工具的數(shù)據(jù)處理腳本,就能夠設(shè)置特定表的缺省加載策略;同時(shí),它還能夠從備份恢復(fù)數(shù)據(jù)、數(shù)據(jù)處理等場(chǎng)景,快速?gòu)?fù)制、交換全表數(shù)據(jù)。除此之外,多節(jié)點(diǎn)并行加載單個(gè)共享大文件,充分利用所有或部分節(jié)點(diǎn)并行加載單個(gè)共享大文件,大幅提升大文件加載性能。
值得一提的是,處理半結(jié)構(gòu)化數(shù)據(jù)Flex Table以前只支持copy語(yǔ)句裝載數(shù)據(jù),現(xiàn)在可以支持Insert語(yǔ)句,新的[]操作符號(hào)能夠簡(jiǎn)化訪問(wèn)分層的VMap數(shù)據(jù)。在大數(shù)據(jù)計(jì)算的日益復(fù)雜背景下,機(jī)器學(xué)習(xí)也在深入發(fā)展,得益于更好的并行計(jì)算和擴(kuò)展能力,Vertica機(jī)器學(xué)習(xí)算法快于Spark,不再需要逼數(shù)據(jù)搬家。
2.與Hadoop、Kafka和Spark集成
Vertica內(nèi)置新的支持hdfs原生協(xié)議的libhdfs++包,替代原來(lái)基于webhdfs的HDFS Connector,libhdfs++更穩(wěn)定性能更好,并且Parquet格式Reader性能大幅提升;ORC和Parquet支持Hive風(fēng)格的分區(qū)列。
Kafka連接器增強(qiáng),Scheduler微批量任務(wù)定義支持同一個(gè)表的數(shù)據(jù)來(lái)自多個(gè)kafka集群、多個(gè)topic;監(jiān)控視圖stream_microbatch_history增加了更明確的微批結(jié)束原因;MC增加專門的微批量加載監(jiān)控頁(yè)面;升級(jí)了rdkafka開(kāi)源庫(kù),解決了rdkafka在特定場(chǎng)景下釋放句柄時(shí)被夯住的問(wèn)題。
Spark高效地從Vertica獲取數(shù)據(jù)、探索模型,通過(guò)謂詞下推和無(wú)關(guān)列數(shù)據(jù)裁剪,高效地準(zhǔn)備訓(xùn)練和測(cè)試模型的數(shù)據(jù)。Spark也可以把數(shù)據(jù)加載到Vertica進(jìn)行高級(jí)分析。另外,Spark可以作為ETL工具替代MapReduce,Spark streaming可以作為流式計(jì)算引擎,結(jié)果可以快速并行存儲(chǔ)到Vertica中,進(jìn)行高級(jí)SQL分析。
3.性能提升
HPE Vertica8.0優(yōu)化Catalog大小和鎖爭(zhēng)搶,以及新的glibc,提升并發(fā)查詢性能以及寬表加載執(zhí)行計(jì)劃階段的性能。節(jié)點(diǎn)復(fù)原(Recovery)性能也有所提升。
Vertica8.0的節(jié)點(diǎn)故障后查詢性能提升近1倍。優(yōu)化器在節(jié)點(diǎn)故障發(fā)生時(shí),Vertica8.0會(huì)把分布方式、排序和編碼一致的buddy projection同等看來(lái),同時(shí)進(jìn)行并行掃描和應(yīng)用所有優(yōu)化策略,使得大部分查詢的性能與正常時(shí)相近,從而避免延遲物化等某些優(yōu)化策略的無(wú)法應(yīng)用。
4.監(jiān)控管理
Vertica8.0的管理控制臺(tái)也增添了新特性,其擴(kuò)展的集中系統(tǒng)監(jiān)控,能夠整合歷史消息、事件和監(jiān)控統(tǒng)計(jì)信息,全面了解數(shù)據(jù)庫(kù)的運(yùn)行狀態(tài);新增加Kafka活動(dòng)監(jiān)控功能,可以監(jiān)控微批量加載的性能和健康狀況;在云環(huán)境方面,管理控制臺(tái)MC已經(jīng)是AMI的一部分。
Vertica8.0還自定義Email告警閥值,能夠通過(guò)Email、管理控制臺(tái)消息中心、以及RESTful API 通知告警。
5.Vertica的持續(xù)創(chuàng)新之路
HPE Vertica以其卓越的性能、久經(jīng)驗(yàn)證的市場(chǎng)實(shí)踐,已經(jīng)贏得了包括Amazon cloud在內(nèi)的云分析平臺(tái)以及Windows Azure的支持。更多的主流云平臺(tái)認(rèn)證,還在路上。相信Vertica8.0的問(wèn)世,將為客戶帶來(lái)更多超乎想象的收益。