自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

第6期:我們需要怎樣的OLAP?

企業(yè)動(dòng)態(tài)
OLAP是商業(yè)智能應(yīng)用中重要的組成部分,這個(gè)詞從字面上理解是在線分析的意思,也就是由用戶,特別是業(yè)務(wù)人員,面對(duì)數(shù)據(jù)進(jìn)行各種分析操作。但是,現(xiàn)在的OLAP概念被嚴(yán)重狹義化了。

第六期封面 

被狹義化的OLAP

OLAP是商業(yè)智能應(yīng)用中重要的組成部分,這個(gè)詞從字面上理解是在線分析的意思,也就是由用戶,特別是業(yè)務(wù)人員,面對(duì)數(shù)據(jù)進(jìn)行各種分析操作。

但是,現(xiàn)在的OLAP概念被嚴(yán)重狹義化了。說到OLAP,基本上僅指多維分析,也就是針對(duì)一個(gè)事先建設(shè)好的數(shù)據(jù)立方體,按指定維度層次進(jìn)行匯總并呈現(xiàn)成表格或圖形,再輔以鉆取、聚合、旋轉(zhuǎn)、切片等操作以變換維度層次及匯總范圍。多維分析的基本思路認(rèn)為,直接觀察大范圍統(tǒng)計(jì)值過于粗略,無法精確定位問題,需要?jiǎng)兝O抽絲似地對(duì)可能有問題的大范圍統(tǒng)計(jì)值一步步鉆取到更細(xì)層次,以達(dá)到分析目的。

更廣義的OLAP過程

多維分析就是在線分析的全部嗎?

我們來考察這樣一種數(shù)據(jù)分析過程。

任何一個(gè)行業(yè)中有多年工作經(jīng)驗(yàn)的從業(yè)人員一般都會(huì)對(duì)自己從事的業(yè)務(wù)產(chǎn)生一些猜測(cè),如:

股票分析師會(huì)猜測(cè)滿足某種條件的股票容易上漲;

公司經(jīng)理對(duì)哪些銷售員擅長(zhǎng)對(duì)付難度大的客戶心里會(huì)有數(shù);

班主任也大概知道偏科同學(xué)的成績(jī)都有什么特征;

這些猜測(cè)是預(yù)測(cè)的基礎(chǔ)。業(yè)務(wù)系統(tǒng)運(yùn)行一段時(shí)間后會(huì)積累出大量數(shù)據(jù),這些猜測(cè)就很可能被這些積累的數(shù)據(jù)驗(yàn)證,證實(shí)了則可作為一種規(guī)律性的結(jié)論,用于指導(dǎo)下一步的動(dòng)作,證偽了則再重新猜測(cè)。

這才是在線分析應(yīng)該做的事情!基本的動(dòng)作就是猜測(cè)和驗(yàn)證,其目的是從歷史數(shù)據(jù)中找到規(guī)律或支撐某些結(jié)論的論據(jù)。而在線分析軟件要做的事情,就是幫助業(yè)務(wù)人員針對(duì)數(shù)據(jù)去驗(yàn)證猜測(cè)。

這里需要注意的是,這些猜測(cè)都是由有經(jīng)驗(yàn)的業(yè)務(wù)人員做出的,而不是軟件系統(tǒng)!之所以需要在線,是由于許多猜測(cè)都是業(yè)務(wù)人員看到了某個(gè)中間結(jié)果后臨時(shí)想出來的。不可能也不需要事先設(shè)計(jì)端到端的完整路徑,也就是無法建模。而且由于其臨時(shí)性,業(yè)務(wù)人員在驗(yàn)證猜測(cè)時(shí)也無法借助技術(shù)人員的能力。

技術(shù)上,就是需要讓業(yè)務(wù)人員有能力對(duì)數(shù)據(jù)進(jìn)行靈活交互式的查詢和計(jì)算。比如結(jié)合上面舉的例子,用戶要完成的計(jì)算可能是這樣的:

這個(gè)月內(nèi)連漲3天的股票,第4天還繼續(xù)上漲的比率有多大?

哪些半年不出單的客戶在更換了銷售人員后半年就出單了?

語文和數(shù)學(xué)成績(jī)都在前10名的學(xué)生,英語成績(jī)排名是怎樣的?

多維分析的局限

顯然,上述計(jì)算都可以由歷史數(shù)據(jù)計(jì)算出來,但是,用多維分析技術(shù)能實(shí)現(xiàn)嗎?

恐怕不能!

多維分析在技術(shù)上有兩個(gè)不足:一是立方體要事先準(zhǔn)備,業(yè)務(wù)用戶沒有臨時(shí)設(shè)計(jì)和改造立方體的能力,一旦有新的分析需求則必須重建立方體;二是立方體上可實(shí)施的分析動(dòng)作單調(diào),只有鉆取、聚合、切片、旋轉(zhuǎn)等少數(shù)幾種,難以完成多步驟的復(fù)雜計(jì)算行為。近年來流行的敏捷BI產(chǎn)品都有多維分析功能,在操作的流暢性和界面的炫麗度都較早期OLAP產(chǎn)品有較大的提升,但本質(zhì)功能并沒有變,該不能算的還是不能算。

多維分析確實(shí)能夠得到一些有益的信息,比如經(jīng)常舉的例子,成本過高時(shí)可以精確定位出到底是哪個(gè)部門和業(yè)務(wù)造成的。但是,多維分析卻得不到前述例子中我們希望從數(shù)據(jù)中獲得的規(guī)律性結(jié)論,而畢竟有了規(guī)律性結(jié)論才能預(yù)測(cè)并指導(dǎo)工作。從這個(gè)意義上講,把在線分析僅僅理解成多維分析是不完整的。

我們需要怎樣的OLAP?

用于規(guī)律發(fā)現(xiàn)(更確切地說是規(guī)律驗(yàn)證)的OLAP軟件應(yīng)當(dāng)是什么樣的呢?

前面說過,從技術(shù)上講,規(guī)律驗(yàn)證可以看成是一種針對(duì)數(shù)據(jù)的查詢和計(jì)算過程,其關(guān)鍵點(diǎn)在于這種過程可以由業(yè)務(wù)人員自由定義,無須技術(shù)人員參與。結(jié)合當(dāng)前的應(yīng)用環(huán)境,我們認(rèn)為這種OLAP應(yīng)當(dāng)具體這樣兩種功能:

1. 關(guān)聯(lián)查詢

分析的***步是獲取數(shù)據(jù)。許多企業(yè)都有建設(shè)好的數(shù)據(jù)倉(cāng)庫,可由業(yè)務(wù)人員自行查詢。這里強(qiáng)調(diào)關(guān)聯(lián)的意義在于,絕大多數(shù)軟件都不能很好地讓業(yè)務(wù)人員實(shí)現(xiàn)帶有關(guān)聯(lián)的查詢需求,必須事先由技術(shù)人員建模消除關(guān)聯(lián)(類似多維分析的立方體建設(shè)),而業(yè)務(wù)人員的需求常常超過事先建模的范圍,又必須求助于技術(shù)人員,這樣就使在線分析的基礎(chǔ)不存在了。

2. 交互計(jì)算

有了數(shù)據(jù)后就是計(jì)算。這種計(jì)算的特點(diǎn)在于要根據(jù)上一步的結(jié)果臨時(shí)決定下一步動(dòng)作,不能事先設(shè)計(jì)程序,所以必須是交互式的,很象計(jì)算器的模式。另外,這里需要計(jì)算的數(shù)據(jù)都是批量的結(jié)構(gòu)化數(shù)據(jù),而非簡(jiǎn)單的數(shù)值,區(qū)別于普通數(shù)值計(jì)算器,可以把這個(gè)功能形象地稱為數(shù)據(jù)計(jì)算器。Excel在一定程度上就擁有這種能力,使得它事實(shí)上成為應(yīng)用最廣泛的桌面BI工具。不過Excel對(duì)于多層次數(shù)據(jù)和有規(guī)則操作支持還不夠好,難以完成前述例子中的計(jì)算過程。

那么,該如何妥善地提供這兩個(gè)功能呢?這不是一兩句話能解釋清楚的,需要仔細(xì)分析現(xiàn)有技術(shù)手段的細(xì)節(jié),找出問題所在后加以改進(jìn),我們將在后續(xù)文章中會(huì)陸續(xù)涉及。

責(zé)任編輯:杜寧 來源: 51CTO專欄
相關(guān)推薦

2013-07-24 11:46:47

網(wǎng)絡(luò)·安全技術(shù)周刊

2011-06-10 14:21:54

網(wǎng)絡(luò)安全技術(shù)周刊

2025-01-22 14:25:54

2011-08-31 14:04:18

IPv6網(wǎng)絡(luò)·安全技術(shù)周刊

2017-07-04 22:55:09

存儲(chǔ)過程數(shù)據(jù)庫存儲(chǔ)過程移植

2010-04-13 00:02:22

Visual StudIDE

2022-11-10 20:29:21

數(shù)據(jù)湖

2021-02-03 09:43:02

人工智能AI基礎(chǔ)教育

2021-02-04 15:31:12

人工智能教育工具

2021-02-08 08:34:55

存儲(chǔ)列式 OLAP

2022-04-13 14:04:14

銳捷

2011-08-03 10:50:28

網(wǎng)絡(luò)安全技術(shù)周刊

2015-01-05 10:43:04

IT技術(shù)周刊

2019-07-29 10:23:04

IPv6手機(jī)Android

2019-11-21 20:45:31

大咖來了面向交互人工智能

2013-01-15 10:37:34

2014-05-19 11:09:01

IT技術(shù)周刊

2013-05-02 10:40:45

網(wǎng)絡(luò)·安全技術(shù)周刊

2018-02-06 23:30:07

文件存儲(chǔ)數(shù)據(jù)

2017-05-25 08:56:22

硬盤性能特征
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)