數(shù)據(jù)可觀察性 VS 數(shù)據(jù)質量
譯文隨著企業(yè)從越來越多的信息源收集到了無窮無盡的數(shù)據(jù)流,他們開始積累一個由數(shù)據(jù)存儲、潛在終端用戶和信息管道組成的生態(tài)系統(tǒng)。隨著生態(tài)系統(tǒng)愈加復雜,數(shù)據(jù)停機,以及數(shù)據(jù)部分、錯誤、缺失或其他不準確的時刻,都會成倍增加。因此,數(shù)據(jù)團隊把大部分時間花在了數(shù)據(jù)質量問題上,而不是花在了為企業(yè)創(chuàng)收的工作上。
數(shù)據(jù)可觀察性可以被定義為整體視圖,包括監(jiān)測、跟蹤和分流事件以防止系統(tǒng)停機。同時,數(shù)據(jù)質量是對如何適應數(shù)據(jù)集以滿足企業(yè)的特定需求的衡量。
它們在哪里重疊?
數(shù)據(jù)可觀察性是用來提高數(shù)據(jù)質量的。當組織采用數(shù)據(jù)可觀察性來提高數(shù)據(jù)質量時,必然會有很大的效果。其中一些包括:
1、在影響用戶體驗前發(fā)現(xiàn)數(shù)據(jù)異常,從而節(jié)約企業(yè)成本。當異常發(fā)生時,數(shù)據(jù)可觀察性引擎會立即提醒團隊,從而使企業(yè)有時間和機會在問題影響到消費者之前進行調查和排除故障。由于數(shù)據(jù)工程團隊在問題涉及利益相關者之前就得到了通知,他們可以及時修復數(shù)據(jù)管道,避免未來的異常情況危及數(shù)據(jù)完整性。
2、通過追蹤字段級線狀數(shù)據(jù)的可觀察性來改善合作,有助于理解它們之間的依賴關系。
3、通過掌握被廢棄的數(shù)據(jù)集來提高生產力,數(shù)據(jù)可觀察性使關鍵數(shù)據(jù)資產的相關性和使用模式更加透明,在不同屬性被廢棄時通知他們。
4、通過減少解決令人厭煩的數(shù)據(jù)消防演習的時間來促進成本節(jié)約,并重新獲得對關鍵決策數(shù)據(jù)的信任。
5、更好的協(xié)調數(shù)據(jù)工程和數(shù)據(jù)分析師團隊之間的關系,有助于理解數(shù)據(jù)資產之間的關鍵依賴關系。
6、通過增加對數(shù)據(jù)資產的健康狀況、使用模式和相關性的端到端可視性,推動更高的效率和生產力。
由此,可以得出結論,數(shù)據(jù)可觀察性和數(shù)據(jù)質量依賴企業(yè)的良好運作。盡管有區(qū)別,但兩者在各種方面都有重疊,有助于提高數(shù)據(jù)質量,更好的交付產品。
原文標題:Data observability vs data quality
原文作者:Vanitha