一文知曉什么是數(shù)據(jù)分析
隨著數(shù)字化轉(zhuǎn)型普遍開展,數(shù)據(jù)分析飛速發(fā)展。無論您的組織屬于哪個行業(yè),數(shù)據(jù)分析都可能在制定戰(zhàn)略中發(fā)揮著關鍵作用。許多公司現(xiàn)在都有數(shù)據(jù)分析師,他們對原始數(shù)據(jù)采用數(shù)據(jù)挖掘技術,從這個過程中獲得的許多可行的洞察和見解。
同時,數(shù)據(jù)分析軟件市場迅速攀升。根據(jù)IDC的數(shù)據(jù),2021年,全球在大數(shù)據(jù)和業(yè)務分析解決方案上的支出增長10.1%,達到2157億美元。許多公司正在積極招聘數(shù)據(jù)科學家和數(shù)據(jù)分析師實現(xiàn)“數(shù)據(jù)驅(qū)動的決策”。
Gartner的研究人員得出結論:“數(shù)據(jù)和分析越來越成為業(yè)務戰(zhàn)略的主要驅(qū)動力,數(shù)據(jù)驅(qū)動的業(yè)務戰(zhàn)略和信息產(chǎn)品的潛力比以往任何時候都大?!睋?jù)該研究公司稱,到2023年,在垂直和特定領域數(shù)據(jù)挖掘技術的推動下,整體分析采用率將從35%增加到50%。
鑒于數(shù)據(jù)分析趨勢在現(xiàn)代企業(yè)中發(fā)揮的重要作用,有必要研究一下“什么是數(shù)據(jù)分析?”以及為什么它很重要以及未來的趨勢是什么。接下來我們將談論以下幾個問題:
- 什么是數(shù)據(jù)分析
- 數(shù)據(jù)科學與數(shù)據(jù)分析
- 數(shù)據(jù)分析的類型
- 為什么數(shù)據(jù)分析很重要
- 數(shù)據(jù)分析的好處
- 數(shù)據(jù)分析的趨勢
一 、什么是數(shù)據(jù)分析
數(shù)據(jù)分析是分析數(shù)據(jù)趨勢獲取知識和洞察力以做出更好決策的過程。這個復雜的過程由數(shù)據(jù)分析師和數(shù)據(jù)科學家以及非技術人員協(xié)作進行的。該過程通常從原始數(shù)據(jù)開始,這些數(shù)據(jù)經(jīng)過數(shù)據(jù)挖掘,尋求有價值的洞察力——事實上,競爭優(yōu)勢是業(yè)務數(shù)據(jù)分析的主要目標。
可以肯定的是,數(shù)據(jù)分析的定義與其他一些技術定義相比變化較小,主要是因為專家一致認為數(shù)據(jù)分析幾乎涵蓋了組織可能對原始數(shù)據(jù)執(zhí)行的任何操作。例如,Gartner將數(shù)據(jù)分析定義為“對所有用途(運營和分析)的數(shù)據(jù)進行管理,并對數(shù)據(jù)進行分析,以通過更有效的決策制定和增強的客戶體驗來推動業(yè)務流程并改善業(yè)務成果?!?/p>
這些定義基本涵蓋現(xiàn)代企業(yè)中常見的活動。數(shù)據(jù)分析主要包括以下內(nèi)容:
(1) 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是將原始數(shù)據(jù)轉(zhuǎn)化為業(yè)務可用信息的過程。最常見的方法是通過各種數(shù)據(jù)挖掘軟件來尋找數(shù)據(jù)中的模式。數(shù)據(jù)挖掘是數(shù)據(jù)分析的子集。此外,數(shù)據(jù)挖掘是人工智能和機器學習的基礎組件。多年來已經(jīng)開發(fā)了許多技術來實際應用和實踐數(shù)據(jù)挖掘。每種技術都建立在跟蹤一組數(shù)據(jù)中的模式的基本思想之上??梢愿鶕?jù)項目的重點和研究的深度持續(xù)優(yōu)化數(shù)據(jù)挖掘方法。例如,可以使用關聯(lián)來簡單地關聯(lián)多個因變量,可以深入研究并利用異常值和異常檢測來篩選大型數(shù)據(jù)集并發(fā)現(xiàn)任何異常。
(2) 文本分析
大多數(shù)文本分析利用人工智能驅(qū)動的自然語言處理(NLP)來解釋人類語言。人工智能、機器學習和數(shù)據(jù)分析的最新發(fā)展使得計算機系統(tǒng)從文檔中的結構化和非結構化數(shù)據(jù)中提取含義的能力顯著增強。
(3) 數(shù)據(jù)可視化
數(shù)據(jù)可視化工具通過以圖形形式(包括圖表、圖形、迷你圖、信息圖、熱圖或統(tǒng)計圖)表示數(shù)據(jù),在數(shù)據(jù)分析中發(fā)揮著重要作用。以視覺形式呈現(xiàn)的數(shù)據(jù)易于理解和分析,即使是非技術利益相關者也可以做出更有效的實時決策
(4) 商業(yè)智能
商業(yè)智能工具可以快速的實現(xiàn)可視化報告、深度數(shù)據(jù)挖掘、自動化、預測幫助和其他關鍵能力。
(5) 數(shù)據(jù)目錄
數(shù)據(jù)目錄工具可自動發(fā)現(xiàn)整個企業(yè)系統(tǒng)中的數(shù)據(jù)源。它使用元數(shù)據(jù)管理功能來組織數(shù)據(jù),顯示不同數(shù)據(jù)之間的關系,啟用搜索和跟蹤數(shù)據(jù)沿襲,即發(fā)現(xiàn)數(shù)據(jù)的來源。同時,包括數(shù)據(jù)治理功能并支持業(yè)務用戶的自助服務,有些還包括詞匯表,以便用戶對術語有共同的理解。大多數(shù)現(xiàn)代數(shù)據(jù)目錄工具依賴人工智能 (AI)和機器學習 (ML)功能。
(6) 數(shù)據(jù)倉庫
數(shù)據(jù)倉庫工具是大數(shù)據(jù)和數(shù)據(jù)分析中的關鍵組件。數(shù)據(jù)倉庫是為分析軟件提供數(shù)據(jù)的智能數(shù)據(jù)存儲庫,允許用戶進行數(shù)據(jù)挖掘以獲得競爭洞察力。數(shù)據(jù)倉庫通常位于大型數(shù)據(jù)存儲庫(如數(shù)據(jù)庫)和數(shù)據(jù)集市之間。數(shù)據(jù)倉庫軟件通常與ETL 工具一起使用,支持從商業(yè)智能到預測分析的各種報告和分析。
(7) 數(shù)據(jù)湖
數(shù)據(jù)湖是一個存儲庫,以原始格式保存大量原始數(shù)據(jù),直到處理完畢。與使用文件夾、行和列等分層數(shù)據(jù)結構的結構化數(shù)據(jù)倉庫不同,數(shù)據(jù)湖是一種平面文件結構,可在輸入數(shù)據(jù)時保留數(shù)據(jù)的原始結構。湖中的每個數(shù)據(jù)元素都被分配了一個唯一的標識符,并使用一組擴展的元數(shù)據(jù)標簽進行標記。當有人根據(jù)某個元數(shù)據(jù)執(zhí)行業(yè)務查詢時,所有標記的數(shù)據(jù)都會被分析以用于查詢或分析。數(shù)據(jù)湖存在的原因是因為每個人都在從各處收集大量信息,尤其是從物聯(lián)網(wǎng),他們需要將其存儲在某個地方。歷史存儲介質(zhì)是關系數(shù)據(jù)庫。但是這些技術對于我們從各地收集的所有這些數(shù)據(jù)片段來說并不適用。
(8) 數(shù)據(jù)網(wǎng)格
數(shù)據(jù)網(wǎng)格正在成為一種幫助組織更好地處理快速增長的數(shù)據(jù)量、不斷變化的應用程序需求和分布式處理場景的方法??梢詫?shù)據(jù)網(wǎng)格想象成一個橫跨大型網(wǎng)絡的網(wǎng)絡,它連接本地和公共云中的多個位置、類型和數(shù)據(jù)源,并通過多種方法訪問該數(shù)據(jù)以處理、移動、管理、并將數(shù)據(jù)存儲在結構范圍內(nèi)。
(9) 數(shù)據(jù)建模
數(shù)據(jù)建模是將結構和方法應用于數(shù)據(jù)的過程,以便將其轉(zhuǎn)換為有用的形式以進行分析和獲得洞察力。通過準備信息系統(tǒng)中涉及的數(shù)據(jù)模型,可以優(yōu)化數(shù)據(jù)庫設計并了解信息系統(tǒng)中的數(shù)據(jù)流。一個好的數(shù)據(jù)模型是數(shù)據(jù)庫中具體細節(jié)的抽象模型,例如數(shù)據(jù)如何捕獲、數(shù)據(jù)如何在系統(tǒng)中流動、數(shù)據(jù)如何輸入到各個表中,以及在存儲數(shù)據(jù)之前對數(shù)據(jù)應用哪些檢查和約束在數(shù)據(jù)庫中。
(10) 人工智能(AI)
人工智能功能通常分為幾個核心領域:機器學習(ML)、深度學習、預測分析、機器視覺、機器人流程自動化 (RPA)、智能助手和聊天機器人。
(11) 機器學習(ML)
機器學習是人工智能的一個子集,是計算機科學的一部分,專注于創(chuàng)造以人類思維方式思考的計算機。換言之,所有機器學習系統(tǒng)都是人工智能系統(tǒng),但并非所有人工智能系統(tǒng)都具備機器學習能力。
可以將機器學習細分為幾個不同的類別:
- 監(jiān)督學習需要提供哪些輸入與哪些輸出一致的示例。例如,如果想使用監(jiān)督學習來教計算機識別貓的圖片,你會提供一大堆圖像,其中一些被標記為“貓”,一些被標記為“不是貓”?!?機器學習算法將幫助系統(tǒng)學習概括概念,以便它可以識別以前從未遇到過的圖像中的貓。
- 無監(jiān)督學習要求系統(tǒng)從給定的數(shù)據(jù)集中得出自己的結論。例如,如果您有大量在線銷售數(shù)據(jù),可以使用無監(jiān)督學習來查找這些數(shù)據(jù)之間的集群或關聯(lián),從而幫助您改進營銷。例如,您可能會發(fā)現(xiàn) 1980 年初出生、收入超過 5 萬美元的女性對特定品牌的巧克力棒有濃厚的興趣,或者購買特定品牌蘇打水的人也會購買特定品牌的薯片。
- 半監(jiān)督學習是有監(jiān)督學習和無監(jiān)督學習的結合?;氐截埖睦樱僭O你有大量的圖像,其中一些被標記為“貓”和“非貓”,而另一些則沒有。半監(jiān)督學習系統(tǒng)將使用標記的圖像來猜測哪些未標記的圖像包括貓。然后最好的猜測將被反饋到系統(tǒng)中,以幫助它提高其能力,并且循環(huán)將繼續(xù)。
- 強化學習接收類似于懲罰和獎勵的反饋的系統(tǒng)。強化學習(適用于機器學習)的一個經(jīng)典例子是坐在一排老虎機前的賭徒。起初,賭徒不知道哪些老虎機會得到回報或有多好,所以他嘗試了所有老虎機。隨著時間的推移,他發(fā)現(xiàn)有些機器設置得“更寬松”,因此它們的回報更頻繁、金額更高。隨著時間的推移,賭徒會通過更頻繁地玩更寬松的機器來增加他的收入。
(12) 深度學習
深度學習是一種人工智能技術,它已經(jīng)在模仿人類大腦的各個方面取得了進展,使設備能夠處理信息以進行上下文分析和行動。深度學習將 ML 算法擴展到多層神經(jīng)網(wǎng)絡,以制作多層鏈接變量和相關決策的決策樹。在自動駕駛汽車的例子中,前進會導致有關速度、是否需要導航障礙、導航到目的地等方面的決策。然而,這些后續(xù)決策可能會產(chǎn)生反饋,迫使人工智能重新考慮早期的決策并改變它們. 深度學習旨在模仿人腦,讓我們通過被訓練和通過多層近乎同時的決策來學習。
數(shù)據(jù)分析是研發(fā)、工程和戰(zhàn)略規(guī)劃不可或缺的一部分。當然,它是物流和供應鏈管理的核心。每年,分析在信息技術和網(wǎng)絡安全中發(fā)揮著越來越大的作用??偠灾瑤缀鯖]有一個行業(yè)不是由數(shù)據(jù)分析驅(qū)動的。
如今,許多組織都有一名首席數(shù)據(jù)官,其職責是監(jiān)督組織內(nèi)數(shù)據(jù)管理的各個方面,包括數(shù)據(jù)分析和數(shù)據(jù)科學。
二 、數(shù)據(jù)科學與數(shù)據(jù)分析
盡管它們相似且密切相關,但是經(jīng)常混淆,數(shù)據(jù)科學和數(shù)據(jù)分析并不是一回事。簡而言之,數(shù)據(jù)分析是一門商業(yè)學科,而數(shù)據(jù)科學是一門技術學科。數(shù)據(jù)分析的目標是回答特定的業(yè)務問題,而數(shù)據(jù)科學的目標是準備、轉(zhuǎn)換和組織數(shù)據(jù),使其有用。數(shù)據(jù)分析需要深入了解特定業(yè)務領域,如金融或營銷,而數(shù)據(jù)科學需要深入了解數(shù)學和技術學科,如統(tǒng)計建模和編程。
哈佛商業(yè)評論認為,“數(shù)據(jù)分析是指分析數(shù)據(jù)以回答問題、提取見解和識別趨勢的過程和實踐。數(shù)據(jù)科學的核心是構建、清理和組織數(shù)據(jù)集?!?/p>
數(shù)據(jù)分析師檢查大型數(shù)據(jù)集以識別趨勢、開發(fā)圖表并創(chuàng)建可視化演示文稿,以幫助企業(yè)做出更具戰(zhàn)略性的決策。數(shù)據(jù)科學家使用原型、算法、預測模型和自定義分析來設計和構建數(shù)據(jù)建模和生產(chǎn)的新流程。
在實踐中,數(shù)據(jù)科學家和數(shù)據(jù)分析師經(jīng)常密切合作,甚至可能是組織內(nèi)同一團隊的一部分。
三、數(shù)據(jù)分析的類型
并非所有數(shù)據(jù)分析都是相同的。大多數(shù)專家將數(shù)據(jù)分析分為四種關鍵類型:
(1) 描述性分析
描述性分析描述了過去發(fā)生的事情或當前正在發(fā)生的事情。這種類型的分析可以回答諸如誰、什么、何地、何時以及如何等問題。例如,顯示過去四個季度每月銷售額的銷售報告就是描述性分析的一個示例。這是最容易執(zhí)行的分析類型,但對組織的價值有限。但是不能忽略它,因為描述性分析是更高級分析類型的必要基礎。
(2) 診斷性分析
診斷分析會告訴您發(fā)生某事的原因。例如,如果描述性分析告訴上個季度的銷售額下降,那么診斷分析將幫助找出問題所在。這種類型的分析通常涉及組合多個數(shù)據(jù)集,以對組織的情況進行更全面和準確的評估。也許銷售下降是因為供應鏈問題或惡劣天氣,或者是因為雇用新的銷售人員后失去了一個關鍵客戶。診斷分析可以幫助弄清楚這一點。
(3) 預測性分析
預測分析可幫助您了解接下來可能發(fā)生的事情。它著眼于歷史趨勢,尋找能夠洞察未來的模式。預測分析工具通常依賴于先進的數(shù)據(jù)模型和機器學習技術,這些技術可以提煉影響過去績效的重要因素并將其應用于當前情況。這是一種更先進、更具投機性的分析形式,具有很高的潛在價值。它正在成為一種非常普遍的工具,尤其是對于大型企業(yè)而言。
(4) 規(guī)范性分析
規(guī)范性分析試圖告訴您應該如何應對未來可能發(fā)生的事情。例如,如果預測分析預測下個季度的銷售額會下降,那么規(guī)范性分析可以幫助了解如果降低價格或更改營銷策略或從不同供應商處采購產(chǎn)品,情況可能會發(fā)生怎樣的變化。顯然,規(guī)范分析的潛在好處非常高,但做好規(guī)范分析也非常困難。目前,很少有組織擁有大規(guī)模進行規(guī)范性分析的資源和能力。
大多數(shù)組織從描述性分析開始他們的數(shù)據(jù)分析。隨著時間的推移,它們擴展到診斷分析,然后是預測分析。許多人渴望最終擁有一個成功的規(guī)范性分析程序,以更好地為他們的業(yè)務決策提供信息。
四、為什么數(shù)據(jù)分析很重要
大多數(shù)專家都同意,數(shù)據(jù)分析對現(xiàn)代組織非常重要,因為它可以幫助組織變得更有競爭力。Forrester說:“數(shù)據(jù)是改善客戶體驗和運營效率的關鍵,這反過來又推動了公司的成功。釋放數(shù)據(jù)的全部潛力依賴于可靠的數(shù)據(jù)分析?!?/p>
出于多種原因,組織進行數(shù)據(jù)分析和數(shù)據(jù)科學計劃。使用數(shù)據(jù)分析做的一些最常見的事情包括:
(1) 更好地了解客戶
大多數(shù)組織都可以訪問有關其客戶的各種數(shù)據(jù),包括人口統(tǒng)計、訂單歷史、客戶服務互動、社交媒體、瀏覽歷史、調(diào)查回復等。聘請數(shù)據(jù)分析師來分析這些數(shù)據(jù)可以幫助公司更全面地了解每個客戶以及他們的客戶作為一個整體的總體情況。此外,它可能會突出更好地滿足客戶需求或接觸新買家群體的機會。
(2) 簡化業(yè)務運營
組織內(nèi)有許多流程,從接單、到履行、到供應鏈管理、到客戶服務、再到 IT 運營等等,都是可以衡量的。任何可以衡量的東西,都可以改進。數(shù)據(jù)分析可以幫助跟蹤關鍵績效指標 (KPI) 的進展,并幫助識別當今可能拖慢組織速度的瓶頸。
(3) 識別新的機會
數(shù)據(jù)分析中更有趣的領域之一是空白分析學科。這種做法有助于組織識別今天沒有做但他們未來可以做的業(yè)務。它可以幫助尋找新的客戶、新產(chǎn)品和新的合作伙伴,從而增加收入和利潤。
(4) 利用現(xiàn)有趨勢
即使是最基本的數(shù)據(jù)可視化,也可以輕松查看 KPI 的移動方向和速率。通過識別這些趨勢,通常是通過原始數(shù)據(jù)篩選,可以做更多運作良好的事情,并嘗試糾正錯誤的事情。
(5) 營銷活動更有效
營銷是被數(shù)據(jù)分析改變最多的商業(yè)學科之一。由于如此多的營銷活動以數(shù)字方式進行,營銷團隊擁有大量可用數(shù)據(jù),可以幫助他們確定哪些目標最有可能成為客戶,哪些客戶可能再次購買,哪些客戶有轉(zhuǎn)投競爭對手的危險等等。他們經(jīng)常使用數(shù)據(jù)可視化來幫助數(shù)據(jù)挖掘以獲得業(yè)務洞察力。
(6) 改進定價策略
如果僅將價格提高 1% 就可以將組織的整體利潤提高多達 10%,那會怎樣?分析可以幫助您分析變量。數(shù)據(jù)分析可以幫助定價團隊確定他們應該在哪里提高價格(以及應該在哪里降低價格)以最大限度地提高盈利能力。
(7) 做出更好的決定
人類總是傾向于出于情感原因做出決定,通?;谙热霝橹鞯挠^念,這些觀念可能是真實的,也可能不是真實的。數(shù)據(jù)分析為這種本能提供了強有力的檢查,以便企業(yè)領導者可以看到他們的直覺反應是否可能導致成功。在非常廣泛的意義上,數(shù)據(jù)分析可以幫助企業(yè)改進整個組織的決策。
五、數(shù)據(jù)分析的好處
數(shù)據(jù)分析支持的所有這些活動的最終結果通常在組織的底線中可見。商業(yè)領袖表示,數(shù)據(jù)分析可以幫助他們:
- 通過簡化業(yè)務運營、調(diào)整技術支出規(guī)模、改善庫存管理和更好地與供應商談判來降低成本。
- 通過快速識別新產(chǎn)品機會、改進開發(fā)流程、加快測試速度和提高整體質(zhì)量來加快上市時間。
- 通過更好地滿足客戶需求并為客戶服務代理提供所需的工具、培訓和支持來提高客戶滿意度。
- 通過改進產(chǎn)品供應、加強營銷工作和授權銷售人員來增加銷售額。
- 通過降低成本和優(yōu)化價格來增加利潤。
- 通過分析歷史數(shù)據(jù)和使用機器學習來實現(xiàn)預測性和規(guī)范性分析,提高預測的準確性。
六、數(shù)據(jù)分析的趨勢
在接下來的幾年里,數(shù)據(jù)分析的使用幾乎肯定會繼續(xù)顯著增長。然而,并非所有組織都能通過其分析工作取得成功。
簡而言之,分析現(xiàn)在至關重要。Gartner說:“到 2025 年,80% 尋求擴展數(shù)字業(yè)務的組織將失敗,因為他們沒有采用現(xiàn)代方法進行數(shù)據(jù)和分析治理?!?/p>
除了數(shù)據(jù)治理,其他值得關注的主要趨勢包括:
- 人工智能和機器學習。許多最復雜的數(shù)據(jù)分析形式,包括預測性和規(guī)范性分析,都依賴于人工智能和機器學習能力。隨著這些技術的進步,分析將變得更加強大。
- 合成數(shù)據(jù)。 隱私法規(guī)通常會限制組織可以直接對客戶數(shù)據(jù)執(zhí)行的分析量。解決這個問題的方法之一是使用合成數(shù)據(jù),它是匿名的,通常由數(shù)據(jù)模型和算法生成。
- 多種分析解決方案和中心。 大多數(shù)大型企業(yè)發(fā)現(xiàn)沒有單一的分析解決方案可以滿足整個組織的所有需求。專家表示,最成功的公司很可能是那些找到創(chuàng)新方法來結合其各種分析解決方案和數(shù)據(jù)存儲的公司。
從長遠來看,掌握這些趨勢以及通過數(shù)據(jù)分析工作確定的趨勢的組織可能是最成功的。