每個數(shù)據(jù)開發(fā)人員對商業(yè)智能和數(shù)據(jù)分析都要了解的十個方面
譯文【51CTO.com快譯】 你還記得自動報表被稱為商業(yè)智能或BI的日子嗎?此后不久,技術(shù)用戶和業(yè)務(wù)用戶當(dāng)中圍繞工作流、流程和用戶體驗的討論真正定義了業(yè)務(wù)分析或BA。近期在數(shù)據(jù)分析、預(yù)測建模、側(cè)重數(shù)據(jù)挖掘的機器學(xué)習(xí)以及社會、文本和風(fēng)險分析等方面的進(jìn)步讓人們關(guān)注預(yù)測分析或PA。據(jù)維基百科聲稱,BI、BA和PA側(cè)重于發(fā)現(xiàn)、解讀和傳達(dá)數(shù)據(jù)中有意義的模式,而這就是分析的定義。
商業(yè)智能業(yè)務(wù)分析員(BI BA)與非技術(shù)型主題專家(SME)為伍,了解數(shù)據(jù)要求,以便做出明智合理的決定。預(yù)測分析員(PA)常常是在數(shù)據(jù)挖掘和統(tǒng)計方面有著扎實背景的數(shù)據(jù)科學(xué)家。
真正的商業(yè)智能實施始于主題專家撰寫或引出用戶故事。作為商業(yè)智能業(yè)務(wù)分析員,你要確保撰寫的這些用戶故事表達(dá)了業(yè)務(wù)部門的心聲,可以由業(yè)務(wù)用戶和數(shù)據(jù)技術(shù)員共同探討。比如說,“作為產(chǎn)品經(jīng)理,我要看到供應(yīng)商的部件/組件給每個部門帶來的盈利能力,那樣我才能評估供應(yīng)鏈。”作為保險行業(yè)的預(yù)測分析員,你在評估定價模型的同時,可能挖掘人口統(tǒng)計、心理、計量經(jīng)濟(jì)學(xué)和統(tǒng)計等數(shù)據(jù)。
作為一名開發(fā)人員,你要構(gòu)建代碼,以便請求、驗證、復(fù)制、移動、存儲、轉(zhuǎn)換、推導(dǎo)并顯示格式日益多樣化的數(shù)據(jù)。下面是你處理商業(yè)智能和分析時要了解的十個方面。
1. 自助式BI必不可少。
我們進(jìn)入21世紀(jì)已有近20年。現(xiàn)代商業(yè)智能環(huán)境理應(yīng)為業(yè)務(wù)用戶提供易于使用的數(shù)據(jù)分析功能,比如機場航班查詢亭或銀行ATM。為了增強分析功能,自助式BI應(yīng)當(dāng)與音樂發(fā)現(xiàn)系統(tǒng)一樣豐富。亞馬遜音樂和iTunes允許按類型、年份、歌手及其他元數(shù)據(jù)來發(fā)現(xiàn)音樂。你熟悉那些界面,尋求未知音樂方面的信息。同樣,如果你使用CarMax或Autotrader,實際上有眾多選項可以縮小查找汽車的數(shù)據(jù)挖掘活動。音樂和汽車都有自助選項。難怪如今精明的業(yè)務(wù)用戶要求自助式分析,也懂得自助式分析。
2. 提醒比靜態(tài)報告更受重視。
你的手機用來處理遠(yuǎn)比語音通話多得多的活動。消息本身就是一類重要的編碼信息。不僅限于簡單的SMS,豐富的消息讓用戶對言簡意賅的提醒的期望甚過對文本的期望。照片、表情符、動畫或視頻都完善了之前作為文本消息的信息。相比這種傳統(tǒng)做法:準(zhǔn)備好一份完整的報告以列舉關(guān)鍵績效指標(biāo)方面的變化,往你的手機發(fā)送文本消息都是一種相當(dāng)大的進(jìn)步。
3. 描述性分析只是個起點。
“發(fā)生了什么?”后視鏡很重要。幾十年來,后視鏡并沒有被認(rèn)為是可有可無的配件。報表同樣具有類似的價值。企業(yè)內(nèi)部需要你的多列報表,匯總和鉆取數(shù)據(jù),以便了解過去發(fā)生的活動。數(shù)據(jù)采集的速度和對當(dāng)前及前瞻性分析的需求將決定你的分析成熟度。
4. 數(shù)據(jù)整合不僅限于操作型系統(tǒng)。
如果清點一下內(nèi)部數(shù)據(jù)系統(tǒng),保準(zhǔn)讓你大吃一驚。比如說,一家地區(qū)性銀行有50個或更多個軟件系統(tǒng)在生成數(shù)據(jù),這一點也不稀奇。核心銀行業(yè)務(wù)、柜員管理、ATM、租賃管理以及通過并購得到的重復(fù)系統(tǒng)都有底層的數(shù)據(jù)庫系統(tǒng)。從自主開發(fā)系統(tǒng)、文件管理器,到SQL Server、Oracle、MySQL及其他一大批商業(yè)及開源引擎,不一而足。如果你供職于任何行業(yè)的一家大中型企業(yè),就會熟悉存在的種種DBMS系統(tǒng)、版本和數(shù)據(jù)孤島,一同存在的還有內(nèi)部操作型系統(tǒng)和共享文件系統(tǒng)上Excel文檔中相關(guān)的數(shù)據(jù)子集。
對大多數(shù)行業(yè)來說,這些數(shù)據(jù)之前完全以基于字符的格式存在。近些年來,數(shù)據(jù)已開始包括社交媒體線索、音頻、圖像和視頻。你的數(shù)據(jù)整合流程應(yīng)包括這類數(shù)據(jù)以便分析。挖掘分析時需要包括來自政府和行業(yè)來源的合格的數(shù)據(jù)集,以便提供適當(dāng)?shù)姆治龌A(chǔ)。
5. 診斷性分析回顧過去。
“它為什么會發(fā)生?”是診斷性分析關(guān)注的問題。為什么商業(yè)建筑商未能償還貸款?為什么病人在約會時間過后要等兩個小時?為什么軟件意外停止運行?你對每個例子的分析都需要獲取并挖掘歷史數(shù)據(jù)和元數(shù)據(jù)。
6. 數(shù)據(jù)可視化并不新奇。
你是Tableau開發(fā)人員嗎?它是一款領(lǐng)先的商業(yè)數(shù)據(jù)可視化軟件。用戶尋求數(shù)據(jù)中的趨勢時,可視化是一種常用方法,而不是翻閱一頁頁的報表或借助Excel中的多列排序。就在不久前,可視化還是新奇工具。如今可以使用增強現(xiàn)實來分析數(shù)據(jù)??晒┠氵x擇的平臺包括手機和標(biāo)準(zhǔn)電腦??墒褂脩?yīng)用編程接口和開發(fā)者軟件。你可以構(gòu)建一種“看得見摸得著”的數(shù)據(jù)分析解決方案。你的想象力在用數(shù)據(jù)增強現(xiàn)實方面顯得很寶貴。
7. 預(yù)測性分析預(yù)測概率。
“可能會發(fā)生什么?“預(yù)測性分析專注于預(yù)測未來的幾率和趨勢。你無法訪問未來的數(shù)據(jù),所以只好根據(jù)特定的幾率來預(yù)測結(jié)果。就某個問題而言,數(shù)據(jù)質(zhì)量越高、數(shù)量越多,確定性越高。確定網(wǎng)上顧客會訂購的下一個商品是公認(rèn)的例子。預(yù)測客戶在一段時間內(nèi)的價值經(jīng)常被引用。你可能會運用自身在統(tǒng)計方面的背景,在找出統(tǒng)計關(guān)聯(lián)時,從對一組變量進(jìn)行回歸分析開始入手。系數(shù)促使分析大數(shù)據(jù)集里面的變量和不斷調(diào)整的幾率。你會發(fā)現(xiàn),寶貴的預(yù)測性分析其幾率很少在50%以上。
8. 物聯(lián)網(wǎng)數(shù)據(jù)流分析將無處不在。
物聯(lián)網(wǎng)以典型的事務(wù)型系統(tǒng)通常所沒有的步伐和數(shù)量來提供。車載傳感器生成的數(shù)據(jù)并不依賴道路上的嵌入式設(shè)備。傳感器裝在車上,與車載處理器通信,并與其他車載系統(tǒng)聯(lián)系。無人駕駛汽車就是結(jié)果。你實時分析數(shù)據(jù)流所采用的方法縮小了范圍。你需要過濾掉與研究無關(guān)的“干擾數(shù)據(jù)”。
9. 規(guī)范性分析建議行動措施。
“應(yīng)該采取什么樣的行動措施?”這是規(guī)范性分析試圖要回答的問題。你回答這個問題的方法取決于常常與預(yù)測和風(fēng)險規(guī)避有關(guān)的優(yōu)化或模擬模型。
10. 分析即服務(wù)提供高質(zhì)量的數(shù)據(jù),以便豐富數(shù)據(jù)。
日益成熟的云帶來了許多服務(wù)級別。軟件即服務(wù)由成千上萬個系統(tǒng)來提供,一些很小,比如待辦事務(wù)列表,另一些很龐大,比如多租戶模式的Salesforce CRM?,F(xiàn)在,XX即服務(wù)占有一席之地。因此,數(shù)據(jù)和分析成了關(guān)鍵的服務(wù)。專業(yè)公司和國際知名公司都在提供這項服務(wù):用高質(zhì)量的廣泛數(shù)據(jù)豐富你的內(nèi)部數(shù)據(jù)。IBM的Watson作為一項服務(wù)來提供。你可以迅速連接充分利用REST的API,利用強大的計算能力來處理數(shù)據(jù)。預(yù)計在今后幾年,會廣泛出現(xiàn)針對特定領(lǐng)域的數(shù)據(jù)分析云。你的數(shù)據(jù)會成為用來豐富內(nèi)部分析操作的一種手段。
商業(yè)界變化不斷。商業(yè)智能和分析是你為企業(yè)在趨勢和公司健康運行方面提供指標(biāo)和衡量尺度的手段。
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】