數(shù)據(jù)安全:元數(shù)據(jù)管理分步指南
需要元數(shù)據(jù)管理
組織中有效的元數(shù)據(jù)管理為數(shù)據(jù)提供正確的上下文和描述。此外,為了理解和信任數(shù)據(jù),需要了解其背景——數(shù)據(jù)是如何產(chǎn)生的,以及是如何使用的。此外,需要知道基于這些數(shù)據(jù)做出的決策是什么,以及如何利用它來(lái)獲得更好的競(jìng)爭(zhēng)優(yōu)勢(shì)。
為了在這個(gè)新的數(shù)字時(shí)代取得成功,組織需要?jiǎng)?chuàng)建細(xì)致的數(shù)據(jù)產(chǎn)品。數(shù)據(jù)產(chǎn)品不僅僅是報(bào)告或分析,而是一個(gè)全面的解決方案。在正確的時(shí)間和正確的設(shè)備上向正確的人提供分析、比較、富有洞察力的信息。
如果沒有完整的元數(shù)據(jù)管理解決方案,就很難創(chuàng)建這些數(shù)據(jù)產(chǎn)品。隨著數(shù)據(jù)量的增長(zhǎng)和大數(shù)據(jù)技術(shù)的爆炸式增長(zhǎng),CDO(首席數(shù)據(jù)官)必須著眼于通過(guò)元數(shù)據(jù)更有效地管理其數(shù)據(jù)。根據(jù)最新估計(jì),到
2022 年,元數(shù)據(jù)管理行業(yè)規(guī)模將達(dá)到 78.5 億左右,并且將逐年增長(zhǎng) 27%。
什么是元數(shù)據(jù)?
元數(shù)據(jù)是“提供有關(guān)其他數(shù)據(jù)的信息的數(shù)據(jù)[信息]。這種理解來(lái)自于在上下文中設(shè)置數(shù)據(jù),允許被重用和檢索以用于多種業(yè)務(wù)用途和時(shí)間?!备鶕?jù)印度大學(xué),
“元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),是關(guān)于特定數(shù)據(jù)集、對(duì)象或資源的描述性信息,包括其格式、收集時(shí)間和收集者。雖然元數(shù)據(jù)最常見的是指網(wǎng)絡(luò)資源,但也可以是物理或電子資源??梢允褂密浖詣?dòng)創(chuàng)建或手動(dòng)輸入?!?br>
結(jié)構(gòu)化或結(jié)構(gòu)化的一些典型元數(shù)據(jù)元素非結(jié)構(gòu)化數(shù)據(jù)是: 標(biāo)題、描述和摘要;標(biāo)簽和類別;創(chuàng)建時(shí)間和創(chuàng)建者;最后修改者和時(shí)間;誰(shuí)可以訪問(wèn)或更新。
除此之外,組織中的元數(shù)據(jù)分類為:
結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù)
包括數(shù)據(jù)庫(kù)表的列結(jié)構(gòu)、CSV 文件的標(biāo)題行、來(lái)自 JSON、XML 和 Avro 文件的列定義。
業(yè)務(wù)元數(shù)據(jù)
包括安全級(jí)別、隱私級(jí)別和首字母縮寫詞級(jí)別。IT
和業(yè)務(wù)都需要高質(zhì)量的元數(shù)據(jù)來(lái)理解手頭的信息。如果沒有有用的元數(shù)據(jù),組織就有根據(jù)錯(cuò)誤數(shù)據(jù)做出錯(cuò)誤決策的風(fēng)險(xiǎn)。
什么是元數(shù)據(jù)管理?
圖書館目錄是元數(shù)據(jù)管理的經(jīng)典和最古老的例子之一。查找用于在圖書館目錄中查找書籍作者或主題并搜索所需書籍的書籍。接下來(lái)是雅虎!搜索引擎,在其中索引了來(lái)自各個(gè)網(wǎng)站的所有元數(shù)據(jù)。最后,當(dāng)谷歌通過(guò)處理實(shí)際數(shù)據(jù)來(lái)設(shè)計(jì)元數(shù)據(jù)時(shí),革命發(fā)生了。
為用戶提供了前所未有的深入搜索體驗(yàn),使用戶能夠在所需的上下文中進(jìn)行搜索。然而,企業(yè)元數(shù)據(jù)管理仍處于圖書館目錄級(jí)別(手動(dòng)完成)或 Yahoo
級(jí)別(通過(guò)使用各種元數(shù)據(jù)管理產(chǎn)品完成)。
一個(gè)理想的元數(shù)據(jù)管理程序應(yīng)該是數(shù)據(jù)驅(qū)動(dòng)的并從上下文中派生出來(lái)。提供所有常見問(wèn)題的答案,例如關(guān)于數(shù)據(jù)的人、內(nèi)容、時(shí)間、地點(diǎn)和原因是元數(shù)據(jù)管理。
應(yīng)該如何進(jìn)行有效的 MDM?
以下是確保它的幾個(gè)步驟:
布局政策和程序
有效的元數(shù)據(jù)管理始于元數(shù)據(jù)的政策、程序、工具和人工管理。員工是元數(shù)據(jù)管理的中心。公司必須有工具讓員工之間就數(shù)據(jù)和元數(shù)據(jù)進(jìn)行順暢的交互。以下應(yīng)該是有效元數(shù)據(jù)管理的角色:
CDO 和高管的角色
定義元數(shù)據(jù)管理規(guī)則,并使用一些工具來(lái)執(zhí)行它們。這些規(guī)則應(yīng)包括各種安全方面和元數(shù)據(jù)更改方法。
分析師和其他數(shù)據(jù)公民的角色
分析師應(yīng)遵循元數(shù)據(jù)管理規(guī)則。此外,如果他們?cè)儐?wèn)有關(guān)數(shù)據(jù)和元數(shù)據(jù)的深刻問(wèn)題,這些問(wèn)題和評(píng)論可以被保存。稍后,這可以使其他分析師在研究相同數(shù)據(jù)時(shí)受益。
MDM 工具的功能
應(yīng)該有強(qiáng)大的工具來(lái)提供對(duì)元數(shù)據(jù)的訪問(wèn),并且它們應(yīng)該執(zhí)行高管定義的所有規(guī)則。這些工具可以提供的一些功能包括:
- 樣本數(shù)據(jù)
在這里,我們?cè)谏蓸颖緮?shù)據(jù)的數(shù)據(jù)上打開表格,為元數(shù)據(jù)提供數(shù)據(jù)上下文。因此,我們豐富了我們對(duì)元數(shù)據(jù)的理解。
- 數(shù)據(jù)統(tǒng)計(jì)(配置文件)
統(tǒng)計(jì)信息提供了一些常見問(wèn)題的答案,例如計(jì)數(shù)、不同值、最常用的值、空計(jì)數(shù)、最大值和最小值。
- 血統(tǒng)
能夠幫助了解數(shù)據(jù)的來(lái)源、傳輸方式以及在數(shù)據(jù)到達(dá)之前發(fā)生的各種轉(zhuǎn)換。此外,能夠了解這些數(shù)據(jù)的其他用途。
- 以前的溝通
溝通是有效元數(shù)據(jù)管理的關(guān)鍵,因此將所有與元數(shù)據(jù)相關(guān)的對(duì)話集中在一個(gè)地方很重要。此外,有關(guān)該元數(shù)據(jù)的所有評(píng)論和評(píng)論也應(yīng)在此處提供。
- 與其他元數(shù)據(jù)的關(guān)系
對(duì)于 MDM
工具來(lái)說(shuō),找到數(shù)據(jù)之間的關(guān)系以使數(shù)據(jù)搜索成為可能至關(guān)重要。有多種方法可以實(shí)現(xiàn)這一點(diǎn)——手動(dòng)、人工管理、通過(guò)元數(shù)據(jù)語(yǔ)義匹配自動(dòng)或通過(guò)數(shù)據(jù)匹配自動(dòng)。