使用Access 2007進行數(shù)據(jù)挖掘
什么是數(shù)據(jù)挖掘
專家會告訴你,數(shù)據(jù)挖掘是使用自動化技術(shù)在企業(yè)斥資獲得的數(shù)據(jù)庫中建立有用的趨勢/信息。一旦得到了,這個信息就會被用來改進商業(yè)操作或制定更好的商業(yè)決策。涉及的技術(shù)有很多,包括聯(lián)合分析、集群、分類、模糊邏輯、神經(jīng)網(wǎng)絡和數(shù)據(jù)清理等。然后這些技術(shù)與可視化工具聯(lián)系在一起,這些可視化工具包括報表、圖表、OLAP和其它的工具。
有專家來進行數(shù)據(jù)挖掘是很好,但是其它人群(占99%),那些既不懂數(shù)據(jù)挖掘又沒有時間和資金來獲得專業(yè)數(shù)據(jù)挖掘工具用于他們的數(shù)據(jù)庫的人們該怎么辦呢?他們能夠做什么?
為什么不使用流行的Microsoft Access工具而不是新工具來探究我們的數(shù)據(jù)庫呢?首先,Access與Microsoft Office/Excel中的圖表工具緊密集成在一起(見圖1)。Access所使用的圖表工具和Excel所使用的工具很類似;主要的不同是Access使用查詢而Excel使用單元。其次,Access支持工業(yè)級SQL查詢,并且其通過Links可以被任何種類的數(shù)據(jù)庫——從文本文件、電子數(shù)據(jù)表、SharePoint Lists、SQL server、Oracle、MySQL等等——當作一個客戶端應用程序。在它之上,設計良好的表單和VBA可以幫助你建立一個界面,從而為你的用戶提供便利,使得他們能夠開始靠他們自己研究他們的數(shù)據(jù)。
在Access 2007中有一些創(chuàng)新,這些創(chuàng)新將幫助人們探究他們的數(shù)據(jù)。這包括在Access 2007和Excel 2007中的非常類似的數(shù)據(jù)過濾界面;在用戶界面上透視圖、透視表是非常有用的,而交互過濾器現(xiàn)在在Access報表中也可以使用了。
圖1 – 透視圖中可用的圖表類型示意
在開始講述不同工具的例子之前,圖2顯示了用來創(chuàng)建本篇文章中的圖表的示例數(shù)據(jù)。
圖2 – 示例數(shù)據(jù)
在查詢和表單中過濾數(shù)據(jù)
所以我們怎樣將Access當作一個數(shù)據(jù)挖掘工具呢?事實是隨著Access 95的問世,它為表和查詢提供了Filter By Selection和Filter by form,從而就有了一組基本的數(shù)據(jù)探究工具可用在查詢和表格里。
例如,F(xiàn)ilter by Selection是一個演示你可以怎樣探究數(shù)據(jù)的主要示例。右鍵單擊年份(比如2008)并選擇Filter by Selection,你將只顯示這個月的銷售。Filter by Selection是最重要的數(shù)據(jù)挖掘技術(shù)中很基本的一個——一個向下鉆取。它是到這個框架之中,在Access 2007中對用戶界面進行過濾來匹配Excel數(shù)據(jù)過濾而做的改變使得Access成為了一個更加通用的工具。這在圖3中做了說明,顯示了新的過濾界面。
圖3 – 現(xiàn)在在Access 2007中的過濾和Excel非常類似
#p#
在查詢中添加總計
如果你想過濾數(shù)據(jù),那么這有一個非常新的創(chuàng)新,它將回答你的大多數(shù)數(shù)據(jù)問題,它就是Totals。當你打開一個查詢,在Home Ribbon中你將找到一個Totals按鈕。點擊它就會有一個額外的記錄添加到你的查詢中,如圖4所示?,F(xiàn)在你可以右鍵單擊這個新的記錄并添加Sums或Averages或Counts之類的東西。這個創(chuàng)新真的很有用,因為以前總是在過濾之后復制黏貼到Excel中去計算總和。
圖4 – 添加一個Totals記錄到一個Access查詢中會降低對額外報表或復制到Excel的需求
將你的查詢轉(zhuǎn)換成數(shù)據(jù)透視表用于更深入的研究
在Access的之前版本中,當你查看一個查詢中的數(shù)據(jù)時,你在查詢界面中處理排序和過濾之外就幾乎什么都不能做了。在Access 2007中,你現(xiàn)在可以將這個查詢轉(zhuǎn)換成一個直接的交互透視網(wǎng)格視圖,它具有大量更進一步的數(shù)據(jù)探究選擇。如果你看了圖5,你會看到當你按這種方式瀏覽查詢時你所得到的界面。此外,當你從一個普通查詢視圖轉(zhuǎn)到一個數(shù)據(jù)透視表視圖時,你所使用的過濾器仍然在使用。
圖5 – 在數(shù)據(jù)透視表視圖中瀏覽查詢
將你的查詢轉(zhuǎn)換成數(shù)據(jù)透視圖表用于更深入的研究
像直接以數(shù)據(jù)透視表的方式來查看查詢一樣,你可以以數(shù)據(jù)透視圖表的方式來查看它們,并使用和數(shù)據(jù)透視表相同的字段和過濾界面。同時這也是一個有用的工具,它要求用戶了解查詢,從而確保將要提取出來的數(shù)據(jù)是適用于這個圖表視圖的。所以如果有了解數(shù)據(jù)庫模型的Access專家坐下來與圖表用戶一起確認他們在以正確的方式來獲取信息,那么這是很好的。通常只要有一兩個好的示例就足夠激發(fā)管理層用戶的創(chuàng)造性了。此外,如果你告訴管理層用戶數(shù)據(jù)透視視圖使用起來是和Excel透視一樣的話,他們會很振奮的。
圖6 – 在數(shù)據(jù)透視圖表視圖中查看圖表形式的查詢
注意,你可以合并透視到表單和報表中作為子報表,但是你需要設置這個子報表的默認視圖屬性為正確的視圖并允許這種類型的視圖。
#p#
在使用中過濾報表
在Access 2007中,現(xiàn)在報表可以在它們將要顯示時被過濾;這使得你可以使你的報表更加強大而幾乎不用做什么修改。要這么做,你可以通過右鍵單擊報表中的一個字段來采用這些過濾選項(它們使用起來就像查詢一樣),如圖7中所做的。
圖7 – 通過過濾一個Access 2007報表來探究數(shù)據(jù)
Microsoft Graphs
現(xiàn)在,你探究數(shù)據(jù)的***一個方法是要使用Microsoft Graph,而這是更加專業(yè)的編程人員的領(lǐng)域。使用MS Graph,當你有大量數(shù)據(jù)時,要查看各個記錄的數(shù)據(jù)是不太實際的。所以對于MS Graph對象,你將幾乎總是對二維圖形和交叉表查詢使用合并查詢(group by),這使得你可以以三維形式顯示數(shù)據(jù)。
舉例來說,這個合并查詢計算了美國的按月瓶裝銷售,這個查詢可以被用來給一個Microsoft Graph提供記錄來源。
|
總結(jié) – 那么你可以怎樣開始探究你的數(shù)據(jù)庫呢
對于專家來說,要使這些工具工作起來的竅門是理解數(shù)據(jù)模型,建立適當?shù)牟樵儾⑺鼈儼惭b到用戶界面中。對于管理層用戶來說,竅門可能就是使開發(fā)人員對一個類似的查詢建立正確工具的一個良好示例,然后使用它作為一個原型來探究你的數(shù)據(jù)。無論你的方法是什么,你在看過這些選擇之后都會同意Access 2007為數(shù)據(jù)挖掘業(yè)余愛好者添加了一些很酷并有用的工具。
【編輯推薦】