使用高性能通用查詢引擎和Data Fabric，管理任何類型、任意云中以及來自任何供應(yīng)商的所有數(shù)據(jù)

作者：IBM 2021-09-01 14:13:05

作為下一代 Cloud Pak for Data 的一部分，IBM 智能Data Fabric中的嵌入式治理也有助于發(fā)揮這些功能的價值和優(yōu)點。

95% 的企業(yè)在混合云環(huán)境中運營，其中大約 2/3 使用多云提供商。[1] 數(shù)據(jù)在多個數(shù)據(jù)存儲、多個位置、多個云甚至多個供應(yīng)商環(huán)境中快速增長，促使許多組織想方設(shè)法通過單一來源簡化數(shù)據(jù)管理 — 這種過程叫作數(shù)據(jù)存儲融合。以前的嘗試依賴于物理數(shù)據(jù)的移動和 ETL 過程，以及數(shù)據(jù)湖等龐大的非結(jié)構(gòu)化數(shù)據(jù)存儲庫?，F(xiàn)在有了一種更好的解決方案，它利用Data Fabric方法中的通用查詢引擎，在洞察平臺上融入治理，支持靈活地訪問各種數(shù)據(jù)存儲、治理和分析功能。

今年早些時候，IBM 在 Think 2021 虛擬會議上介紹了通過 AutoSQL 功能簡化數(shù)據(jù)管理的最新進展。AutoSQL 使用覆蓋各種不同數(shù)據(jù)源的單一分布式查詢，簡化數(shù)據(jù)環(huán)境。AutoSQL 是一種通用查詢引擎，是下一代 IBM Cloud Pak® for Data 的智能Data Fabric功能的一部分。AutoSQL 可訪問數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)湖和流式數(shù)據(jù)，對它們執(zhí)行查詢，而無需額外的手動更改或數(shù)據(jù)移動。通用查詢引擎[2]執(zhí)行分布式和虛擬化查詢的速度要比行業(yè)標準快 53%。通用查詢引擎與Data Fabric中現(xiàn)有的數(shù)據(jù)虛擬化功能相結(jié)合，無需移動數(shù)據(jù)即可在多個云（包括公有云和私有云）中輕松查詢數(shù)據(jù)。AutoSQL 還獨立于供應(yīng)商，支持對任何供應(yīng)商的云平臺上的開放文件格式執(zhí)行查詢。綜上所述，AutoSQL 的作用在于減少工作量和降低成本。由于能夠最大程度消除數(shù)據(jù)移動，減少調(diào)整查詢特定數(shù)據(jù)源所花費的時間，以及能夠在單一平臺上訪問所有數(shù)據(jù)，因此 AutoSQL 可避免數(shù)據(jù)移動帶來的性能影響，使人員能夠更高效地利用自己的時間。

作為下一代 Cloud Pak for Data 的一部分，IBM 智能Data Fabric中的嵌入式治理也有助于發(fā)揮這些功能的價值和優(yōu)點。借助領(lǐng)先的數(shù)據(jù)平臺，使用者可以在所有數(shù)據(jù)存儲中對經(jīng)過質(zhì)量和有效性驗證的數(shù)據(jù)進行查詢。由于基于Data Fabric的通用數(shù)據(jù)基礎(chǔ)固有的可信性，使用者可以更輕松地信任洞察，實施有影響力的行動。此外，尤其考慮到數(shù)據(jù)對于 AI 模型的重要性，更高質(zhì)量的數(shù)據(jù)可能意味著更高效地使用 AI 模型 — 例如，如果模型是根據(jù)略微偏離現(xiàn)實的數(shù)據(jù)進行訓練，那么就要減少需要的更新次數(shù)。自動化元數(shù)據(jù)標記也有助于節(jié)省時間和提高準確性，幫助數(shù)據(jù)用戶更深入地了解要查詢的數(shù)據(jù)集。自動數(shù)據(jù)掩蓋功能使數(shù)據(jù)用戶能夠更輕松地滿足合規(guī)要求，不必擔心會意外訪問自己不應(yīng)訪問的數(shù)據(jù)。數(shù)據(jù)集成和數(shù)據(jù)準備是企業(yè)希望在 2022 [3]年底之前實現(xiàn)自動化的前三種技術(shù)中的兩種，但這方面的技術(shù)進步還無法很快實現(xiàn)。

查看Data Fabric信息圖：https://www.ibm.com/downloads/cas/7WDAED89

治理、Data Fabric和 AutoSQL 只是 IBM Cloud Pak for Data 這樣的洞察平臺中的一小部分功能。包含數(shù)據(jù)收集、治理和分析等多方面功能的預先集成的端到端解決方案意味著，過去拼湊而成的解決方案將被互連而靈活的解決方案所取代，新的解決方案可隨著業(yè)務(wù)需求的增長而擴展。維護多個許可或升級將由單一平臺解決方案取代。當然，這并不意味著企業(yè)被單一供應(yīng)商套牢。如前所述，開放數(shù)據(jù)格式和供應(yīng)商靈活性可幫助企業(yè)輕松集成任何云端的現(xiàn)有數(shù)據(jù)倉庫、數(shù)據(jù)湖和其他解決方案。無論哪種方式，單一的數(shù)據(jù)視圖和為數(shù)據(jù)用戶提供自助服務(wù)的能力仍舊十分重要。此外，使用 IBM Cloud Pak for Data 的客戶可以通過廣泛的合作伙伴生態(tài)系統(tǒng)及其解決方案來完善或增強該解決方案，從而滿足自己更為獨特的需求。

對于尋求更加集成、更為靈活的解決方案的企業(yè)而言，新發(fā)布的 AutoSQL 和 IBM Cloud Pak for Data 上的通用查詢引擎只是新增的優(yōu)勢之一。隨著大量有助于節(jié)省成本的功能和自動化功能的出現(xiàn)，進一步減少人工工作和成本指日可待。詳細了解 IBM Cloud Pak for Data 的優(yōu)點：https://www.ibm.com/products/cloud-pak-for-data

原文鏈接：https://www.ibm.com/blogs/journey-to-ai/2021/05/manage-all-of-your-data/?mhsrc=ibmsearch_a&mhq=data%20fabric

了解更多IBM相關(guān)：http://cloud.51cto.com/act/ibm2021q3/cloud#p3

責任編輯：張燕妮來源： 51CTO

數(shù)據(jù)云架構(gòu)

自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

使用高性能通用查詢引擎和Data Fabric，管理任何類型、任意云中以及來自任何供應(yīng)商的所有數(shù)據(jù)