同樣是用Excel,為什么別人那么優(yōu)秀?
“為什么同樣是用Excel工作,新來的小李竟能比我這資深表哥快這么多”。
對(duì)自己多年練就的“神速做表手”充滿信心的老王怎么也想不明白,為什么自己最快也要兩天才能做好的數(shù)據(jù)報(bào)表,到新來的小李手里只用半天就搞定了。
其實(shí)要解釋老王的疑惑一點(diǎn)也不難,小李站在“表結(jié)構(gòu)”數(shù)據(jù)上跳舞,而老王仍停留在傳統(tǒng)Excel的“表格結(jié)構(gòu)”數(shù)據(jù)上埋頭苦干。
兩者雖然只有一字之差,但“表結(jié)構(gòu)”數(shù)據(jù)比“表格結(jié)構(gòu)”數(shù)據(jù)更具優(yōu)勢,而且這種優(yōu)勢是單憑人的快速熟練的操作技巧所追趕不上的。
1、什么是表結(jié)構(gòu)數(shù)據(jù),什么又是表格結(jié)構(gòu)數(shù)據(jù),兩者間又有什么區(qū)別呢?
- 表格結(jié)構(gòu)數(shù)據(jù)就是我們傳統(tǒng)使用的Excel工作表數(shù)據(jù),
- 表結(jié)構(gòu)數(shù)據(jù)則是像數(shù)據(jù)庫中數(shù)據(jù)表一樣的數(shù)據(jù)結(jié)構(gòu)。
兩者間***的區(qū)別就是基本計(jì)算單位不同。
表格結(jié)構(gòu)數(shù)據(jù)基本計(jì)算單位是單元格,如果在C1單元格中輸入公式“=A1+B1”,則公式將分別引用單元格A1與單元格B1中的值,再將兩個(gè)值相加并在C1單元格中返回計(jì)算結(jié)果。整個(gè)運(yùn)算過程都是基于單元格完成的,像這樣以單元格為參照對(duì)象進(jìn)行計(jì)算的數(shù)據(jù)結(jié)構(gòu)就是表格結(jié)構(gòu)數(shù)據(jù)。
表結(jié)構(gòu)數(shù)據(jù)的基本計(jì)算單位是整列數(shù)據(jù),如下圖所示,先在Excel的A列和B列中分別輸入商品數(shù)量和商品單價(jià)的相關(guān)信息,然后使用開始選項(xiàng)卡中套用表格格式功能將A列和B列中的值轉(zhuǎn)換為表結(jié)構(gòu)數(shù)據(jù),并且在C2單元格中輸入公式“=[@商品數(shù)量]*[@商品單價(jià)]”并點(diǎn)擊回車后……
會(huì)神奇的發(fā)現(xiàn),再不用向下拖拽公式了,所有不同行上的商品數(shù)量與商品單價(jià)的乘積的結(jié)果都會(huì)自動(dòng)顯示在C列中。
這是因?yàn)楸斫Y(jié)構(gòu)數(shù)據(jù)的基本計(jì)算單位是整列數(shù)據(jù),表結(jié)構(gòu)數(shù)據(jù)對(duì)列中所有行上的值進(jìn)行統(tǒng)一計(jì)算,并統(tǒng)一返回所有行上值對(duì)應(yīng)的計(jì)算結(jié)果的原因。
2、表結(jié)構(gòu)數(shù)據(jù)的優(yōu)勢在哪?
表結(jié)構(gòu)數(shù)據(jù)在以下幾個(gè)方面具有表格結(jié)構(gòu)數(shù)據(jù)無法比擬的優(yōu)勢:
- 優(yōu)勢1:可對(duì)零散數(shù)值進(jìn)行不同維度下的匯總觀測
- 優(yōu)勢2:可非常輕松地關(guān)聯(lián)并整合多種不同數(shù)據(jù)源數(shù)據(jù)
- 優(yōu)勢3:可對(duì)大規(guī)模數(shù)據(jù)進(jìn)行批量計(jì)算,其速度遠(yuǎn)大于表格結(jié)構(gòu)數(shù)據(jù)
- 優(yōu)勢4:可在不同表間建立關(guān)聯(lián)關(guān)系,讓所有不同維度數(shù)據(jù)表整合為一個(gè)完整的多維數(shù)據(jù)模型
- 優(yōu)勢5: 多數(shù)表結(jié)構(gòu)數(shù)據(jù)處理工具記錄的是運(yùn)算過程而非計(jì)算結(jié)果,所以一旦記錄好一次完整、準(zhǔn)確的運(yùn)算過程,便可反復(fù)利用,可大幅減少在Excel傳統(tǒng)工作表中進(jìn)行的重復(fù)性工作。
3、表結(jié)構(gòu)數(shù)據(jù)是如何完勝的?
正是以上五點(diǎn)優(yōu)勢幫助站在表結(jié)構(gòu)數(shù)據(jù)上跳舞的小李完勝了還在表格結(jié)構(gòu)數(shù)據(jù)上苦干的老王,那么為什么小李會(huì)完勝老王呢?
老王要制作的數(shù)據(jù)報(bào)表需要先從多個(gè)不同的數(shù)據(jù)源中采集數(shù)據(jù),這些數(shù)據(jù)有來自于CSV格式文本文件的,Excel的,數(shù)據(jù)庫中多個(gè)不同數(shù)據(jù)表的,TXT格式文本文件等等
每次老王需要一個(gè)個(gè)將這些數(shù)據(jù)源中的數(shù)據(jù)復(fù)制粘貼到自己工作用的Excel文件中的多個(gè)不同工作表中,要處理的數(shù)據(jù)行數(shù)多達(dá)六萬行。
V好數(shù)據(jù)后,當(dāng)前文件很有可能因?yàn)橛?jì)算資源枯竭而導(dǎo)致崩潰,老王需要盡快把這份數(shù)據(jù)轉(zhuǎn)移到一個(gè)新的Excel文件上。
轉(zhuǎn)移過后,老王需要繼續(xù)添加多個(gè)計(jì)算列才能完成一份完整的數(shù)據(jù)源,有了數(shù)據(jù)源后,老王還需要制作多個(gè)數(shù)據(jù)透視表來獲得最終數(shù)據(jù)報(bào)表中使用的匯總值,有了匯總值,老王才可以著手準(zhǔn)備數(shù)據(jù)報(bào)告。
老王負(fù)責(zé)的數(shù)據(jù)報(bào)表是周報(bào),也就是說每周都要重復(fù)一次上述所有的工作流程,在制作報(bào)表過程中哪怕有一步做錯(cuò)了都要再重新來過……
我不想再說下去了,表哥表姐表叔表嫂們心里的苦是說不清道不盡的。
那么面對(duì)同樣的工作問題,已經(jīng)玩轉(zhuǎn)表結(jié)構(gòu)數(shù)據(jù)的小李又是如何做的呢?
小李用到了Excel中專門處理表結(jié)構(gòu)數(shù)據(jù)的Power Query以及Power Pivot工具。
他先用Power Query直接關(guān)聯(lián)到多個(gè)不同數(shù)據(jù)源上,將這些數(shù)據(jù)源中的數(shù)據(jù)統(tǒng)一導(dǎo)入到Power Query數(shù)據(jù)環(huán)境下,然后使用合并功能,輕松將所有不同數(shù)據(jù)源中數(shù)據(jù)匯總到了一起,這就是表結(jié)構(gòu)數(shù)據(jù)***個(gè)優(yōu)勢。
然后小李在整合好的數(shù)據(jù)中添加計(jì)算字段,雖然數(shù)據(jù)量很大,但因?yàn)楸斫Y(jié)構(gòu)數(shù)據(jù)具有“可對(duì)大規(guī)模數(shù)據(jù)進(jìn)行批量計(jì)算,其速度遠(yuǎn)大于表格結(jié)構(gòu)數(shù)據(jù)”的優(yōu)勢,瞬間就完成了所有計(jì)算任務(wù)。
然后小李把加工好的多個(gè)數(shù)據(jù)表一起導(dǎo)入到Power Pivot中創(chuàng)建關(guān)聯(lián)關(guān)系,搭建了統(tǒng)一的多維數(shù)據(jù)環(huán)境,并且在Power Pivot中設(shè)計(jì)了復(fù)雜的匯總計(jì)算規(guī)則,在完整的數(shù)據(jù)環(huán)境上,小李非常輕松的獲得了報(bào)表所需的數(shù)據(jù)匯總值。
并且在此基礎(chǔ)上還為領(lǐng)導(dǎo)提供了可做篩選操作的多個(gè)不同的觀測維度信息。這就是表結(jié)構(gòu)數(shù)據(jù)的第三和第四個(gè)優(yōu)勢。
小李創(chuàng)建的整個(gè)處理過程被完整的記錄在Power Query與Power Pivot中,于是,到了每周出周報(bào)的時(shí)間,小李只需要把數(shù)據(jù)源文件替換好,然后點(diǎn)擊一下Excel中數(shù)據(jù)選項(xiàng)卡下的全部刷新按鈕,稍等片刻,所有工作就全部完成了。再不需要每次都重復(fù)所有的制作過程。
所以一旦記錄好一次完整、準(zhǔn)確的運(yùn)算過程,便可反復(fù)利用,可大幅減少在Excel傳統(tǒng)工作表中進(jìn)行的重復(fù)性工作”成為小李壓倒老王的***一根稻草。在面對(duì)表結(jié)構(gòu)數(shù)據(jù)的高維打擊下,處在低維的表格結(jié)構(gòu)數(shù)據(jù)已經(jīng)開始顯得力不從心。
在業(yè)務(wù)數(shù)據(jù)分析中,常用到的表結(jié)構(gòu)數(shù)據(jù)處理加工分析工具主要有Excel Power BI以及數(shù)據(jù)庫的SQL語句。