使用 IBM Cloud Pak for Data 4.0 大規(guī)模融合智能自動化
您上一次思考自己的企業(yè)是否真正具有預(yù)測能力,以及數(shù)據(jù)人員、模型和應(yīng)用能否輕松訪問適當(dāng)?shù)臄?shù)據(jù),是在什么時候?往往聽到響亮的答復(fù) —“我們不太會去思考這些問題”。隨著數(shù)據(jù)的類型和來源激增,以及法規(guī)越來越嚴(yán)格,數(shù)據(jù)通常被“禁錮”在各個“孤島”之中。傳統(tǒng)上,克服這一挑戰(zhàn)的戰(zhàn)略依賴于將物理數(shù)據(jù)整合到單一的位置、結(jié)構(gòu)和供應(yīng)商。雖然這種戰(zhàn)略從理論層面看似非常有效,但任何進行過如此大規(guī)模遷移的人都會表示:說起來容易做起來難。
今年早些時候,我們在 THINK 大會上公布了下一代 IBM Cloud Pak for Data 計劃,這一替代方案旨在幫助客戶適時將適當(dāng)?shù)娜藛T與適當(dāng)?shù)臄?shù)據(jù)聯(lián)系起來。今天,我很高興與大家分享該平臺的最新版本 (V4.0) 如何通過智能Data Fabric將這一愿景變?yōu)楝F(xiàn)實。
迄今為止所做的工作
自 2018 年推出 IBM Cloud Pak for Data 以來,我們的目標(biāo)一直是幫助客戶發(fā)揮數(shù)據(jù)的價值,并在整個企業(yè)中融入 AI。了解客戶需求后,我們加倍努力,推出首創(chuàng)的容器化平臺,幫助客戶在所選的云環(huán)境中靈活部署所需的數(shù)據(jù)和 AI 服務(wù)的獨特組合。
IBM Cloud Pak for Data 支持生機勃勃的專有服務(wù)、第三方服務(wù)和開源服務(wù)生態(tài)系統(tǒng),我們會在每個發(fā)行版中持續(xù)擴展這些服務(wù)。在 V4.0 中,我們的努力更上了一層樓。新功能和智能自動化可幫助業(yè)務(wù)領(lǐng)導(dǎo)和用戶克服所面臨的壓倒性的數(shù)據(jù)復(fù)雜性,更輕松地擴大數(shù)據(jù)的價值。
實現(xiàn)智能Data Fabric
Data Fabric是一種架構(gòu)模式,可在混合多云環(huán)境中動態(tài)編排各種不同的數(shù)據(jù)源,提供面向業(yè)務(wù)的數(shù)據(jù),以支持分析、AI 和應(yīng)用。IBM Cloud Pak for Data 的模塊化和可定制性質(zhì)提供了一種理想的環(huán)境,可通過針對用戶的獨特需求量身定制的一流解決方案構(gòu)建Data Fabric。平臺中緊密集成了微服務(wù),通過融入智能自動化,幫助進一步簡化分布式數(shù)據(jù)的管理和使用。在 V4.0 中,我們將這種自動化應(yīng)用于三個主要領(lǐng)域:
1. 數(shù)據(jù)訪問和易用性 — AutoSQL 是一種通用查詢引擎,無需移動或復(fù)制數(shù)據(jù),即可自動訪問、更新和統(tǒng)一任何來源或任何類型(云、數(shù)據(jù)倉庫、數(shù)據(jù)湖等)的數(shù)據(jù)。
2. 數(shù)據(jù)采集和編目 — AutoCatalog 可自動發(fā)現(xiàn)和分類數(shù)據(jù),以簡化覆蓋不同數(shù)據(jù)環(huán)境的數(shù)據(jù)資產(chǎn)實時目錄及其關(guān)系的創(chuàng)建過程。
3. 數(shù)據(jù)隱私和安全 — AutoPrivacy 使用 AI,以智能方式自動發(fā)現(xiàn)、監(jiān)控和保護整個組織中的敏感數(shù)據(jù),最大程度地降低風(fēng)險并確保合規(guī)性。
立即獲取Data Fabric架構(gòu)的三大即時優(yōu)勢,了解有關(guān)智能Data Fabric以及如何運用這些新技術(shù)的更多信息。
V4.0 中的其他增強功能
IBM Cloud Pak for Data 中的另一項新服務(wù) IBM Match 360 with Watson 進一步增強了Data Fabric功能的智能自動化。Match 360 提供基于機器學(xué)習(xí)、易于使用的體驗,幫助實體以自助方式解決問題。非開發(fā)人員現(xiàn)在可以匹配和鏈接整個企業(yè)中的數(shù)據(jù),這有助于提高整體數(shù)據(jù)質(zhì)量。
IBM Cloud Pak for Data 4.0 還包含 IBM SPSS Modeler、IBM Decision Optimization 和 Hadoop Execution Engine 服務(wù)。這些功能補充了基礎(chǔ)產(chǎn)品中已有的 IBM Watson Studio 服務(wù),使業(yè)務(wù)分析師和大眾數(shù)據(jù)科學(xué)家等用戶能夠參與構(gòu)建 AI 解決方案。
AutoAI 得到了增強,現(xiàn)在支持關(guān)系型數(shù)據(jù)源,能夠生成可導(dǎo)出的 Python 代碼,使數(shù)據(jù)科學(xué)家能夠?qū)彶楹透?AutoAI 生成的模型。競爭對手的 AutoML 功能生成的模型更像是黑盒,這是我們與他們之間的顯著區(qū)別。
補充功能也在 IBM Cloud Pak for Data as a Service 中發(fā)布,包括 IBM DataStage 和 IBM Data Virtualization。DataStage 實現(xiàn)完全管理,可幫助構(gòu)建現(xiàn)代數(shù)據(jù)集成管道,Data Virtualization 功能有助于在整個組織中接近實時地共享數(shù)據(jù),將受到管理的數(shù)據(jù)連接至 AI 和 ML 工具。
最后,IBM Cloud Pak for Data 4.0 還包含多項平臺增強功能,其中最值得注意的是添加了 Red Hat OpenShift Operators。這些功能有助于自動執(zhí)行 IBM Cloud Pak for Data 的配置、擴展、修補和升級。首次安裝過程得到顯著簡化,降低了實施成本,通過無縫升級將升級時間從幾周縮短到幾個小時。此外,從 V4.0 開始,IBM Cloud Pak for Data 將基于通用的 IBM Cloud Pak 平臺,支持標(biāo)準(zhǔn)化的身份和訪問管理,以及在所有 IBM Cloud Paks 之間的無縫導(dǎo)航。
數(shù)據(jù)對企業(yè)而言是一種巨大的競爭優(yōu)勢,與人工智能結(jié)合的數(shù)據(jù)能夠有力推動業(yè)務(wù)轉(zhuǎn)型。IBM Cloud Pak for Data 的最新版本能夠?qū)⑥D(zhuǎn)型速度加快 10 倍。
了解更多IBM相關(guān):http://cloud.51cto.com/act/ibm2021q3/cloud#p3