大數據管理:挑戰(zhàn)與解決方案
什么是大數據?
大數據是一個術語,用來描述一個組織中以各種形式存在的巨大且快速擴展的數據量,這些數據通常來自多個來源。換言之,數據是巨大、多樣且分散的。大數據對幾乎每一個行業(yè)的企業(yè)決策、產品創(chuàng)造和運營管理都產生了巨大影響。大數據的主要障礙與組織、技術和運營方面的限制有關,例如缺乏基礎設施或熟練人員。讓我們將這些障礙分解為易于管理、易于理解的問題,并提供具體的解決方案。
大數據挑戰(zhàn)及其解決方案
1、數量不斷增長
挑戰(zhàn):大數據名副其實。企業(yè)擁有數兆字節(jié)的數據,這些數據不斷擴展,如果處理不當,可能很快就失控。企業(yè)失去了從數據資產中獲得價值的機會,因為在缺乏足夠的設計、處理能力和基礎設施的情況下,其無法跟上這種擴展。
解決方案:利用存儲和管理技術來處理與大數據管理相關的日益增長的數量和困難。確保決策與組織需求和業(yè)務目標相一致,無論是使用云計算、本地托管還是混合策略。構建工具和可擴展的架構,以適應不斷增長的數據量而不犧牲其完整性。
2、數據質量低下
挑戰(zhàn):大數據的主要問題之一是質量低下,僅美國每年就花費超過3萬億美元。那么,錯誤數據究竟是什么?不一致的、過時的、缺失的、錯誤的、難以辨認的和重復的數據可能會降低整個集合的質量。即使是很小的錯誤和不一致也可能導致嚴重的大數據問題。因此,監(jiān)控其質量至關重要。否則,弊大于利。錯誤、低效率和誤導性的見解是由糟糕的數據質量引起的,它們最終會給組織帶來成本。
解決方案:建立內部方法和人員來處理數據是實現良好數據衛(wèi)生的第一步。應該建立適當的數據治理,決定訪問控制和數據管理的工具和協議。利用許多可用的當前數據管理技術來建立一個有效的過程,以各種方式清理、過濾、排序、豐富和管理數據。
3、數據來源多,集成難度大
挑戰(zhàn):顯然,數據越多越好。但前提是,知道如何為協作分析編譯信息,否則更多的數據通常不會轉化為更大的價值。事實上,尋找或創(chuàng)建能帶來洞察力和集成異構數據的觸點是大數據倡議面臨的兩個最困難的問題。
解決方案:制作一個清單,以確定數據的來源,以及將其集成以進行協作分析是否有意義。使用數據集成技術鏈接來自多個來源的數據,包括數據庫、文件、應用和數據倉庫,并為大數據分析做好準備??梢允褂胮recise或Qlik等產品,這些產品是專業(yè)的數據集成解決方案,又或者可以使用Microsoft、SAP、Oracle或企業(yè)目前使用的其他技術。
4、項目和基礎設施成本增加
挑戰(zhàn):阻礙高管將數據貨幣化的主要障礙之一是有限的IT預算。實施大數據的成本很高。其包括龐大的初期投資,且不能立即獲得回報,因此謹慎的準備是必要的。此外,基礎設施隨著數據量的增加而迅速擴展。有時候,可能會很容易忘記財產及維護其的費用。
解決方案:通過定期監(jiān)控基礎設施,大數據可以解決大多數日益增加的成本問題。在構建數據處理管道時,要及早考慮費用。選擇負擔得起的工具,滿足經濟限制。良好的開發(fā)和數據運行方法有助于平衡可擴展性成本,找到節(jié)省成本的可能性,并監(jiān)控用于數據管理和存儲的服務和資源。
5、洞察時間長
挑戰(zhàn):“洞察時間”這個術語描述的是在數據變得過時和不可用之前,需要多長時間才能從數據中得出結論。低效的數據管理技術和費力的數據管道導致的大數據問題之一是獲得洞察力的時間很長。在某些業(yè)務場景中,這個指標比其他指標更重要。
解決方案:當從事物聯網和大數據項目時,自動化和遠程控制嚴重依賴于低延遲,應該考慮利用邊緣和霧技術來提供盡可能接近行動的分析。對實時數據的快速響應將成為可能,而洞察的時間將縮短。
不必堅持嚴格的數據方法。在創(chuàng)建和構建數據管道時,采用靈活的方法并定期進行檢查,以確定效率低下和速度下降的情況。利用大數據可視化工具和方法,以及當代人工智能技術,更快地提供和傳播見解。