使用高性能通用查詢引擎和Data Fabric,管理任何類型、任意云中以及來自任何供應(yīng)商的所有數(shù)據(jù)
95% 的企業(yè)在混合云環(huán)境中運營,其中大約 2/3 使用多云提供商。[1] 數(shù)據(jù)在多個數(shù)據(jù)存儲、多個位置、多個云甚至多個供應(yīng)商環(huán)境中快速增長,促使許多組織想方設(shè)法通過單一來源簡化數(shù)據(jù)管理 — 這種過程叫作數(shù)據(jù)存儲融合。以前的嘗試依賴于物理數(shù)據(jù)的移動和 ETL 過程,以及數(shù)據(jù)湖等龐大的非結(jié)構(gòu)化數(shù)據(jù)存儲庫?,F(xiàn)在有了一種更好的解決方案,它利用Data Fabric方法中的通用查詢引擎,在洞察平臺上融入治理,支持靈活地訪問各種數(shù)據(jù)存儲、治理和分析功能。
今年早些時候,IBM 在 Think 2021 虛擬會議上介紹了通過 AutoSQL 功能簡化數(shù)據(jù)管理的最新進展。AutoSQL 使用覆蓋各種不同數(shù)據(jù)源的單一分布式查詢,簡化數(shù)據(jù)環(huán)境。AutoSQL 是一種通用查詢引擎,是下一代 IBM Cloud Pak® for Data 的智能Data Fabric功能的一部分。AutoSQL 可訪問數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)湖和流式數(shù)據(jù),對它們執(zhí)行查詢,而無需額外的手動更改或數(shù)據(jù)移動。通用查詢引擎[2]執(zhí)行分布式和虛擬化查詢的速度要比行業(yè)標準快 53%。通用查詢引擎與Data Fabric中現(xiàn)有的數(shù)據(jù)虛擬化功能相結(jié)合,無需移動數(shù)據(jù)即可在多個云(包括公有云和私有云)中輕松查詢數(shù)據(jù)。AutoSQL 還獨立于供應(yīng)商,支持對任何供應(yīng)商的云平臺上的開放文件格式執(zhí)行查詢。綜上所述,AutoSQL 的作用在于減少工作量和降低成本。由于能夠最大程度消除數(shù)據(jù)移動,減少調(diào)整查詢特定數(shù)據(jù)源所花費的時間,以及能夠在單一平臺上訪問所有數(shù)據(jù),因此 AutoSQL 可避免數(shù)據(jù)移動帶來的性能影響,使人員能夠更高效地利用自己的時間。
作為下一代 Cloud Pak for Data 的一部分,IBM 智能Data Fabric中的嵌入式治理也有助于發(fā)揮這些功能的價值和優(yōu)點。借助領(lǐng)先的數(shù)據(jù)平臺,使用者可以在所有數(shù)據(jù)存儲中對經(jīng)過質(zhì)量和有效性驗證的數(shù)據(jù)進行查詢。由于基于Data Fabric的通用數(shù)據(jù)基礎(chǔ)固有的可信性,使用者可以更輕松地信任洞察,實施有影響力的行動。此外,尤其考慮到數(shù)據(jù)對于 AI 模型的重要性,更高質(zhì)量的數(shù)據(jù)可能意味著更高效地使用 AI 模型 — 例如,如果模型是根據(jù)略微偏離現(xiàn)實的數(shù)據(jù)進行訓練,那么就要減少需要的更新次數(shù)。自動化元數(shù)據(jù)標記也有助于節(jié)省時間和提高準確性,幫助數(shù)據(jù)用戶更深入地了解要查詢的數(shù)據(jù)集。自動數(shù)據(jù)掩蓋功能使數(shù)據(jù)用戶能夠更輕松地滿足合規(guī)要求,不必擔心會意外訪問自己不應(yīng)訪問的數(shù)據(jù)。數(shù)據(jù)集成和數(shù)據(jù)準備是企業(yè)希望在 2022 [3]年底之前實現(xiàn)自動化的前三種技術(shù)中的兩種,但這方面的技術(shù)進步還無法很快實現(xiàn)。
查看Data Fabric信息圖:https://www.ibm.com/downloads/cas/7WDAED89
治理、Data Fabric和 AutoSQL 只是 IBM Cloud Pak for Data 這樣的洞察平臺中的一小部分功能。包含數(shù)據(jù)收集、治理和分析等多方面功能的預先集成的端到端解決方案意味著,過去拼湊而成的解決方案將被互連而靈活的解決方案所取代,新的解決方案可隨著業(yè)務(wù)需求的增長而擴展。維護多個許可或升級將由單一平臺解決方案取代。當然,這并不意味著企業(yè)被單一供應(yīng)商套牢。如前所述,開放數(shù)據(jù)格式和供應(yīng)商靈活性可幫助企業(yè)輕松集成任何云端的現(xiàn)有數(shù)據(jù)倉庫、數(shù)據(jù)湖和其他解決方案。無論哪種方式,單一的數(shù)據(jù)視圖和為數(shù)據(jù)用戶提供自助服務(wù)的能力仍舊十分重要。此外,使用 IBM Cloud Pak for Data 的客戶可以通過廣泛的合作伙伴生態(tài)系統(tǒng)及其解決方案來完善或增強該解決方案,從而滿足自己更為獨特的需求。
對于尋求更加集成、更為靈活的解決方案的企業(yè)而言,新發(fā)布的 AutoSQL 和 IBM Cloud Pak for Data 上的通用查詢引擎只是新增的優(yōu)勢之一。隨著大量有助于節(jié)省成本的功能和自動化功能的出現(xiàn),進一步減少人工工作和成本指日可待。詳細了解 IBM Cloud Pak for Data 的優(yōu)點:https://www.ibm.com/products/cloud-pak-for-data
了解更多IBM相關(guān):http://cloud.51cto.com/act/ibm2021q3/cloud#p3