數(shù)據(jù)庫設(shè)計(jì)過程
一、數(shù)據(jù)庫設(shè)計(jì)過程
數(shù)據(jù)庫技術(shù)是信息資源管理最有效的手段。數(shù)據(jù)庫設(shè)計(jì)是指對(duì)于一個(gè)給定的應(yīng)用環(huán)境,構(gòu)造***的數(shù)據(jù)庫模式,建立數(shù)據(jù)庫及其應(yīng)用系統(tǒng),有效存儲(chǔ)數(shù)據(jù),滿足用戶信息要求和處理要求。
數(shù)據(jù)庫設(shè)計(jì)中需求分析階段綜合各個(gè)用戶的應(yīng)用需求(現(xiàn)實(shí)世界的需求),在概念設(shè)計(jì)階段形成獨(dú)立于機(jī)器特點(diǎn)、獨(dú)立于各個(gè)dbms產(chǎn)品的概念模式(信息世界模型),用e-r圖來描述。在邏輯設(shè)計(jì)階段將e-r圖轉(zhuǎn)換成具體的數(shù)據(jù)庫產(chǎn)品支持的數(shù)據(jù)模型如關(guān)系模型,形成數(shù)據(jù)庫邏輯模式。然后根據(jù)用戶處理的要求,安全性的考慮,在基本表的基礎(chǔ)上再建立必要的視圖(view)形成數(shù)據(jù)的外模式。在物理設(shè)計(jì)階段根據(jù)dbms特點(diǎn)和處理的需要,進(jìn)行物理存儲(chǔ)安排,設(shè)計(jì)索引,形成數(shù)據(jù)庫內(nèi)模式。
1. 需求分析階段
需求收集和分析,結(jié)果得到數(shù)據(jù)字典描述的數(shù)據(jù)需求(和數(shù)據(jù)流圖描述的處理需求)。
需求分析的重點(diǎn)是調(diào)查、收集與分析用戶在數(shù)據(jù)管理中的信息要求、處理要求、安全性與完整性要求。
需求分析的方法:調(diào)查組織機(jī)構(gòu)情況、調(diào)查各部門的業(yè)務(wù)活動(dòng)情況、協(xié)助用戶明確對(duì)新系統(tǒng)的各種要求、確定新系統(tǒng)的邊界。
常用的調(diào)查方法有: 跟班作業(yè)、開調(diào)查會(huì)、請(qǐng)專人介紹、詢問、設(shè)計(jì)調(diào)查表請(qǐng)用戶填寫、查閱記錄。
分析和表達(dá)用戶需求的方法主要包括自頂向下和自底向上兩類方法。自頂向下的結(jié)構(gòu)化分析方法(structured analysis,簡(jiǎn)稱sa方法)從最上層的系統(tǒng)組織機(jī)構(gòu)入手,采用逐層分解的方式分析系統(tǒng),并把每一層用數(shù)據(jù)流圖和數(shù)據(jù)字典描述。
數(shù)據(jù)流圖表達(dá)了數(shù)據(jù)和處理過程的關(guān)系。系統(tǒng)中的數(shù)據(jù)則借助數(shù)據(jù)字典(data dictionary,簡(jiǎn)稱dd)來描述。
數(shù)據(jù)字典是各類數(shù)據(jù)描述的集合,它是關(guān)于數(shù)據(jù)庫中數(shù)據(jù)的描述,即元數(shù)據(jù),而不是數(shù)據(jù)本身。數(shù)據(jù)字典通常包括數(shù)據(jù)項(xiàng)、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)流、數(shù)據(jù)存儲(chǔ)和處理過程五個(gè)部分(至少應(yīng)該包含每個(gè)字段的數(shù)據(jù)類型和在每個(gè)表內(nèi)的主外鍵)。
數(shù)據(jù)項(xiàng)描述={數(shù)據(jù)項(xiàng)名,數(shù)據(jù)項(xiàng)含義說明,別名,數(shù)據(jù)類型,長(zhǎng)度,
取值范圍,取值含義,與其他數(shù)據(jù)項(xiàng)的邏輯關(guān)系}
數(shù)據(jù)結(jié)構(gòu)描述={數(shù)據(jù)結(jié)構(gòu)名,含義說明,組成:{數(shù)據(jù)項(xiàng)或數(shù)據(jù)結(jié)構(gòu)}}
數(shù)據(jù)流描述={數(shù)據(jù)流名,說明,數(shù)據(jù)流來源,數(shù)據(jù)流去向,
組成:{數(shù)據(jù)結(jié)構(gòu)},平均流量,高峰期流量}
數(shù)據(jù)存儲(chǔ)描述={數(shù)據(jù)存儲(chǔ)名,說明,編號(hào),流入的數(shù)據(jù)流,流出的數(shù)據(jù)流,
組成:{數(shù)據(jù)結(jié)構(gòu)},數(shù)據(jù)量,存取方式}
處理過程描述={處理過程名,說明,輸入:{數(shù)據(jù)流},輸出:{數(shù)據(jù)流},
處理:{簡(jiǎn)要說明}}
2. 概念結(jié)構(gòu)設(shè)計(jì)階段
通過對(duì)用戶需求進(jìn)行綜合、歸納與抽象,形成一個(gè)獨(dú)立于具體dbms的概念模型,可以用e-r圖表示。
概念模型用于信息世界的建模。概念模型不依賴于某一個(gè)dbms支持的數(shù)據(jù)模型。概念模型可以轉(zhuǎn)換為計(jì)算機(jī)上某一dbms支持的特定數(shù)據(jù)模型。
概念模型特點(diǎn):
(1) 具有較強(qiáng)的語義表達(dá)能力,能夠方便、直接地表達(dá)應(yīng)用中的各種語義知識(shí)。
(2) 應(yīng)該簡(jiǎn)單、清晰、易于用戶理解,是用戶與數(shù)據(jù)庫設(shè)計(jì)人員之間進(jìn)行交流的語言。
概念模型設(shè)計(jì)的一種常用方法為idef1x方法,它就是把實(shí)體-聯(lián)系方法應(yīng)用到語義數(shù)據(jù)模型中的一種語義模型化技術(shù),用于建立系統(tǒng)信息模型。
使用idef1x方法創(chuàng)建e-r模型的步驟如下所示:
2.1 第零步——初始化工程
這個(gè)階段的任務(wù)是從目的描述和范圍描述開始,確定建模目標(biāo),開發(fā)建模計(jì)劃,組織建模隊(duì)伍,收集源材料,制定約束和規(guī)范。收集源材料是這階段的重點(diǎn)。通過調(diào)查和觀察結(jié)果,業(yè)務(wù)流程,原有系統(tǒng)的輸入輸出,各種報(bào)表,收集原始數(shù)據(jù),形成了基本數(shù)據(jù)資料表。
2.2 ***步——定義實(shí)體
實(shí)體集成員都有一個(gè)共同的特征和屬性集,可以從收集的源材料——基本數(shù)據(jù)資料表中直接或間接標(biāo)識(shí)出大部分實(shí)體。根據(jù)源材料名字表中表示物的術(shù)語以及具有 “代碼”結(jié)尾的術(shù)語,如客戶代碼、代理商代碼、產(chǎn)品代碼等將其名詞部分代表的實(shí)體標(biāo)識(shí)出來,從而初步找出潛在的實(shí)體,形成初步實(shí)體表。
2.3 第二步——定義聯(lián)系
idef1x模型中只允許二元聯(lián)系,n元聯(lián)系必須定義為n個(gè)二元聯(lián)系。根據(jù)實(shí)際的業(yè)務(wù)需求和規(guī)則,使用實(shí)體聯(lián)系矩陣來標(biāo)識(shí)實(shí)體間的二元關(guān)系,然后根據(jù)實(shí)際情況確定出連接關(guān)系的勢(shì)、關(guān)系名和說明,確定關(guān)系類型,是標(biāo)識(shí)關(guān)系、非標(biāo)識(shí)關(guān)系(強(qiáng)制的或可選的)還是非確定關(guān)系、分類關(guān)系。如果子實(shí)體的每個(gè)實(shí)例都需要通過和父實(shí)體的關(guān)系來標(biāo)識(shí),則為標(biāo)識(shí)關(guān)系,否則為非標(biāo)識(shí)關(guān)系。非標(biāo)識(shí)關(guān)系中,如果每個(gè)子實(shí)體的實(shí)例都與而且只與一個(gè)父實(shí)體關(guān)聯(lián),則為強(qiáng)制的,否則為非強(qiáng)制的。如果父實(shí)體與子實(shí)體代表的是同一現(xiàn)實(shí)對(duì)象,那么它們?yōu)榉诸愱P(guān)系。
2.4 第三步——定義碼
通過引入交叉實(shí)體除去上一階段產(chǎn)生的非確定關(guān)系,然后從非交叉實(shí)體和獨(dú)立實(shí)體開始標(biāo)識(shí)侯選碼屬性,以便唯一識(shí)別每個(gè)實(shí)體的實(shí)例,再從侯選碼中確定主碼。為了確定主碼和關(guān)系的有效性,通過非空規(guī)則和非多值規(guī)則來保證,即一個(gè)實(shí)體實(shí)例的一個(gè)屬性不能是空值,也不能在同一個(gè)時(shí)刻有一個(gè)以上的值。找出誤認(rèn)的確定關(guān)系,將實(shí)體進(jìn)一步分解,***構(gòu)造出idef1x模型的鍵基視圖(kb圖)。
2.5 第四步——定義屬性
從源數(shù)據(jù)表中抽取說明性的名詞開發(fā)出屬性表,確定屬性的所有者。定義非主碼屬性,檢查屬性的非空及非多值規(guī)則。此外,還要檢查完全依賴函數(shù)規(guī)則和非傳遞依賴規(guī)則,保證一個(gè)非主碼屬性必須依賴于主碼、整個(gè)主碼、僅僅是主碼。以此得到了至少符合關(guān)系理論第三范式的改進(jìn)的idef1x模型的全屬性視圖。
2.6 第五步——定義其他對(duì)象和規(guī)則
定義屬性的數(shù)據(jù)類型、長(zhǎng)度、精度、非空、缺省值、約束規(guī)則等。定義觸發(fā)器、存儲(chǔ)過程、視圖、角色、同義詞、序列等對(duì)象信息。
3. 邏輯結(jié)構(gòu)設(shè)計(jì)階段
將概念結(jié)構(gòu)轉(zhuǎn)換為某個(gè)dbms所支持的數(shù)據(jù)模型(例如關(guān)系模型),并對(duì)其進(jìn)行優(yōu)化。設(shè)計(jì)邏輯結(jié)構(gòu)應(yīng)該選擇最適于描述與表達(dá)相應(yīng)概念結(jié)構(gòu)的數(shù)據(jù)模型,然后選擇最合適的dbms。
將e-r圖轉(zhuǎn)換為關(guān)系模型實(shí)際上就是要將實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系轉(zhuǎn)化為關(guān)系模式,這種轉(zhuǎn)換一般遵循如下原則:
1)一個(gè)實(shí)體型轉(zhuǎn)換為一個(gè)關(guān)系模式。實(shí)體的屬性就是關(guān)系的屬性。實(shí)體的碼就是關(guān)系的碼。
2)一個(gè)m:n聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式。與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性。而關(guān)系的碼為各實(shí)體碼的組合。
3)一個(gè)1:n聯(lián)系可以轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式,也可以與n端對(duì)應(yīng)的關(guān)系模式合并。如果轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式,則與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性,而關(guān)系的碼為n端實(shí)體的碼。
4)一個(gè)1:1聯(lián)系可以轉(zhuǎn)換為一個(gè)獨(dú)立的關(guān)系模式,也可以與任意一端對(duì)應(yīng)的關(guān)系模式合并。
5)三個(gè)或三個(gè)以上實(shí)體間的一個(gè)多元聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式。與該多元聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性均轉(zhuǎn)換為關(guān)系的屬性。而關(guān)系的碼為各實(shí)體碼的組合。
6)同一實(shí)體集的實(shí)體間的聯(lián)系,即自聯(lián)系,也可按上述1:1、1:n和m:n三種情況分別處理。
7)具有相同碼的關(guān)系模式可合并。
為了進(jìn)一步提高數(shù)據(jù)庫應(yīng)用系統(tǒng)的性能,通常以規(guī)范化理論為指導(dǎo),還應(yīng)該適當(dāng)?shù)匦薷?、調(diào)整數(shù)據(jù)模型的結(jié)構(gòu),這就是數(shù)據(jù)模型的優(yōu)化。確定數(shù)據(jù)依賴。消除冗余的聯(lián)系。確定各關(guān)系模式分別屬于第幾范式。確定是否要對(duì)它們進(jìn)行合并或分解。一般來說將關(guān)系分解為3nf的標(biāo)準(zhǔn),即:
表內(nèi)的每一個(gè)值都只能被表達(dá)一次。
•?表內(nèi)的每一行都應(yīng)該被唯一的標(biāo)識(shí)(有唯一鍵)。
表內(nèi)不應(yīng)該存儲(chǔ)依賴于其他鍵的非鍵信息。
4. 數(shù)據(jù)庫物理設(shè)計(jì)階段
為邏輯數(shù)據(jù)模型選取一個(gè)最適合應(yīng)用環(huán)境的物理結(jié)構(gòu)(包括存儲(chǔ)結(jié)構(gòu)和存取方法)。根據(jù)dbms特點(diǎn)和處理的需要,進(jìn)行物理存儲(chǔ)安排,設(shè)計(jì)索引,形成數(shù)據(jù)庫內(nèi)模式。
5. 數(shù)據(jù)庫實(shí)施階段
運(yùn)用dbms提供的數(shù)據(jù)語言(例如sql)及其宿主語言(例如c),根據(jù)邏輯設(shè)計(jì)和物理設(shè)計(jì)的結(jié)果建立數(shù)據(jù)庫,編制與調(diào)試應(yīng)用程序,組織數(shù)據(jù)入庫,并進(jìn)行試運(yùn)行。 數(shù)據(jù)庫實(shí)施主要包括以下工作:用ddl定義數(shù)據(jù)庫結(jié)構(gòu)、組織數(shù)據(jù)入庫 、編制與調(diào)試應(yīng)用程序、數(shù)據(jù)庫試運(yùn)行
6. 數(shù)據(jù)庫運(yùn)行和維護(hù)階段
數(shù)據(jù)庫應(yīng)用系統(tǒng)經(jīng)過試運(yùn)行后即可投入正式運(yùn)行。在數(shù)據(jù)庫系統(tǒng)運(yùn)行過程中必須不斷地對(duì)其進(jìn)行評(píng)價(jià)、調(diào)整與修改。包括:數(shù)據(jù)庫的轉(zhuǎn)儲(chǔ)和恢復(fù)、數(shù)據(jù)庫的安全性、完整性控制、數(shù)據(jù)庫性能的監(jiān)督、分析和改進(jìn)、數(shù)據(jù)庫的重組織和重構(gòu)造。
建模工具的使用
為加快數(shù)據(jù)庫設(shè)計(jì)速度,目前有很多數(shù)據(jù)庫輔助工具(case工具),如rational公司的rational rose,ca公司的erwin和bpwin,sybase公司的powerdesigner以及oracle公司的oracle designer等。
erwin主要用來建立數(shù)據(jù)庫的概念模型和物理模型。它能用圖形化的方式,描述出實(shí)體、聯(lián)系及實(shí)體的屬性。erwin支持idef1x方法。通過使用 erwin建模工具自動(dòng)生成、更改和分析idef1x模型,不僅能得到優(yōu)秀的業(yè)務(wù)功能和數(shù)據(jù)需求模型,而且可以實(shí)現(xiàn)從idef1x模型到數(shù)據(jù)庫物理設(shè)計(jì)的轉(zhuǎn)變。erwin工具繪制的模型對(duì)應(yīng)于邏輯模型和物理模型兩種。在邏輯模型中,idef1x工具箱可以方便地用圖形化的方式構(gòu)建和繪制實(shí)體聯(lián)系及實(shí)體的屬性。在物理模型中,erwin可以定義對(duì)應(yīng)的表、列,并可針對(duì)各種數(shù)據(jù)庫管理系統(tǒng)自動(dòng)轉(zhuǎn)換為適當(dāng)?shù)念愋汀?br />
設(shè)計(jì)人員可根據(jù)需要選用相應(yīng)的數(shù)據(jù)庫設(shè)計(jì)建模工具。例如需求分析完成之后,設(shè)計(jì)人員可以使用erwin畫er圖,將er圖轉(zhuǎn)換為關(guān)系數(shù)據(jù)模型,生成數(shù)據(jù)庫結(jié)構(gòu);畫數(shù)據(jù)流圖,生成應(yīng)用程序。
以上就是我要為大家介紹的數(shù)據(jù)庫設(shè)計(jì)的全部?jī)?nèi)容,希望大家從中可以學(xué)到東西,然后有利于以后的工作學(xué)習(xí)。
【編輯推薦】