自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MySQL數(shù)據(jù)庫(kù)中char與varchar之爭(zhēng)

數(shù)據(jù)庫(kù) MySQL
在數(shù)據(jù)庫(kù)中,字符型的數(shù)據(jù)是最多的,可以占到整個(gè)數(shù)據(jù)庫(kù)的80%以上。為此正確處理字符型的數(shù)據(jù),對(duì)于提高數(shù)據(jù)庫(kù)的性能有很大的作用。在字符型數(shù)據(jù)中,用的最多的就是Char與Varchar兩種類型。前面的是固定長(zhǎng)度,而后面的是可變長(zhǎng)度。現(xiàn)在我們需要考慮的是,在什么情況下使用Char字符型數(shù)據(jù),什么情況下采用Varchar字符型數(shù)據(jù)。

在數(shù)據(jù)庫(kù)中,字符型的數(shù)據(jù)是最多的,可以占到整個(gè)數(shù)據(jù)庫(kù)的80%以上。為此正確處理字符型的數(shù)據(jù),對(duì)于提高數(shù)據(jù)庫(kù)的性能有很大的作用。在字符型數(shù)據(jù)中,用的最多的就是Char與Varchar兩種類型。前面的是固定長(zhǎng)度,而后面的是可變長(zhǎng)度?,F(xiàn)在我們需要考慮的是,在什么情況下使用Char字符型數(shù)據(jù),什么情況下采用Varchar字符型數(shù)據(jù)。在這部分內(nèi)容中,我就跟大家來(lái)探討一下這個(gè)話題。

一、VARCHAR與CHAR字符型數(shù)據(jù)的差異

在MySQL數(shù)據(jù)庫(kù)中,用的最多的字符型數(shù)據(jù)類型就是Varchar和Char.。這兩種數(shù)據(jù)類型雖然都是用來(lái)存放字符型數(shù)據(jù),但是無(wú)論從結(jié)構(gòu)還是從數(shù)據(jù)的保存方式來(lái)看,兩者相差很大。而且其具體的實(shí)現(xiàn)方式,還依賴與存儲(chǔ)引擎。我這里就以大家最常用的MYISAM存儲(chǔ)引擎為例,談?wù)勥@兩種數(shù)據(jù)類型的差異。在后續(xù)建議中,也是針對(duì)這種存儲(chǔ)類型而言的。

這里首先需要明白的一點(diǎn)是,這兩種數(shù)據(jù)類型,無(wú)論采用哪一種存儲(chǔ)引起,系統(tǒng)存儲(chǔ)數(shù)據(jù)的方式都是不同的。正是因?yàn)槿绱?,我們才有必要研究?jī)烧叩牟煌?。然后在合適的情況下,采用恰當(dāng)?shù)姆绞?。了解這一點(diǎn)之后,我們?cè)賮?lái)看后續(xù)的內(nèi)容。

Varchar往往用來(lái)保存可變長(zhǎng)度的字符串。簡(jiǎn)單的說(shuō),我們只是給其固定了一個(gè)最大值,然后系統(tǒng)會(huì)根據(jù)實(shí)際存儲(chǔ)的數(shù)據(jù)量來(lái)分配合適的存儲(chǔ)空間。為此相比CHAR字符數(shù)據(jù)而言,其能夠比固定長(zhǎng)度類型占用更少的存儲(chǔ)空間。不過(guò)在實(shí)際工作中,由于某系特殊的原因,會(huì)在這里設(shè)置例外。如管理員可以根據(jù)需要指定ROW_FORMAT=FIXED選項(xiàng)。利用這個(gè)選項(xiàng)來(lái)創(chuàng)建MyISAM表的話,系統(tǒng)將會(huì)為每一行使用固定長(zhǎng)度的空間。此時(shí)會(huì)造成存儲(chǔ)空間的損耗。通常情況下,VARCHAR數(shù)據(jù)類型能夠節(jié)約磁盤空間,為此往往認(rèn)為其能夠提升數(shù)據(jù)庫(kù)的性能。不過(guò)這里需要注意的是,這往往是一把雙刃劍。其在提升性能的同時(shí),往往也會(huì)產(chǎn)生一些副作用。如因?yàn)槠溟L(zhǎng)度是可變的,為此在數(shù)據(jù)進(jìn)行更新時(shí)可能會(huì)導(dǎo)致一些額外的工作。如在更改前,其字符長(zhǎng)度是10位(Varchar規(guī)定的最長(zhǎng)字符數(shù)假設(shè)是50位),此時(shí)系統(tǒng)就只給其分配10個(gè)存儲(chǔ)的位置(假設(shè)不考慮系統(tǒng)自身的開(kāi)銷)。更改后,其數(shù)據(jù)量達(dá)到了20位。由于沒(méi)有超過(guò)最大50位的限制,為此數(shù)據(jù)庫(kù)還是允許其存儲(chǔ)的。只是其原先的存儲(chǔ)位置已經(jīng)無(wú)法滿足其存儲(chǔ)的需求。此時(shí)系統(tǒng)就需要進(jìn)行額外的操作。如根據(jù)存儲(chǔ)引擎不同,有的會(huì)采用拆分機(jī)制,而有的則會(huì)采用分頁(yè)機(jī)制。

CHAR數(shù)據(jù)類型與VARCHAR數(shù)據(jù)類型不同,其采用的是固定長(zhǎng)度的存儲(chǔ)方式。簡(jiǎn)單的說(shuō),就是系統(tǒng)總為其分配最大的存儲(chǔ)空間。當(dāng)數(shù)據(jù)保存時(shí),即使其沒(méi)有達(dá)到最大的長(zhǎng)度,系統(tǒng)也會(huì)為其分配這么多的存儲(chǔ)空間。顯然,這種存儲(chǔ)方式會(huì)造成磁盤空間的浪費(fèi)。這里筆者需要提醒的一點(diǎn)是,當(dāng)字符位數(shù)不足時(shí),系統(tǒng)并不會(huì)采用空格來(lái)填充。相反,如果在保存CHAR值的時(shí)候,如果其后面有空值,系統(tǒng)還會(huì)自動(dòng)過(guò)濾其空格。而在進(jìn)行數(shù)據(jù)比較時(shí),系統(tǒng)又會(huì)將空格填充到字符串的末尾。

顯然,VARCHAR與CHAR兩種字符型數(shù)據(jù)類型相比,最大的差異就是前者是可變長(zhǎng)度,而后者則是固定長(zhǎng)度。在存儲(chǔ)時(shí),前者會(huì)根據(jù)實(shí)際存儲(chǔ)的數(shù)據(jù)來(lái)分配最終的存儲(chǔ)空間。而后者則不管實(shí)際存儲(chǔ)數(shù)據(jù)的長(zhǎng)度,都是根據(jù)CHAR規(guī)定的長(zhǎng)度來(lái)分配存儲(chǔ)空間。這是否意味著CHAR的數(shù)據(jù)類型劣于VARCHAR呢?其實(shí)不然。否則的話,就沒(méi)有必要存在CHAR字符類型了。雖然VARCHAR數(shù)據(jù)類型可以節(jié)省存儲(chǔ)空間,提高數(shù)據(jù)處理的效率。但是其可變長(zhǎng)度帶來(lái)的一些負(fù)面效應(yīng),有時(shí)候會(huì)抵消其帶來(lái)的優(yōu)勢(shì)。為此在某些情況下,還是需要使用Char數(shù)據(jù)類型。

二、項(xiàng)目建議

根據(jù)上面的分析,我們知道VARCHAR數(shù)據(jù)類型是一把雙刃劍,其在帶來(lái)性能提升的同時(shí),也可能會(huì)存在著一些額外的消耗。我們?cè)谠u(píng)估到底是使用VARCHAR數(shù)據(jù)類型還是采用CHAR數(shù)據(jù)類型時(shí),就需要進(jìn)行均衡。在實(shí)際項(xiàng)目中,我們會(huì)考量如下情況。

一是根據(jù)字符的長(zhǎng)度來(lái)判斷。

如某個(gè)字段,像人的名字,其最長(zhǎng)的長(zhǎng)度也是有限的。如我們給其分配18個(gè)字符長(zhǎng)度即可。此時(shí)雖然每個(gè)人的名字長(zhǎng)度有可能不同,但是即使為其分配了固定長(zhǎng)度的字符類型,即18個(gè)字符長(zhǎng)度,最后浪費(fèi)的空間也不是很大。而如果采用NVARCHAR數(shù)據(jù)類型時(shí),萬(wàn)一以后需要改名,而原先的存儲(chǔ)空間不足用來(lái)容納新的值,反而會(huì)造成一些額外的工作。在這種情況下,進(jìn)行均衡時(shí),會(huì)認(rèn)為采用CHAR固定長(zhǎng)度的數(shù)據(jù)類型更好。在實(shí)際項(xiàng)目中,如果某個(gè)字段的字符長(zhǎng)度比較短此時(shí)一般是采用固定字符長(zhǎng)度。

二是考慮其長(zhǎng)度的是否相近。

如果某個(gè)字段其長(zhǎng)度雖然比較長(zhǎng),但是其長(zhǎng)度總是近似的,如一般在90個(gè)到100個(gè)字符之間,甚至是相同的長(zhǎng)度。此時(shí)比較適合采用CHAR字符類型。比較典型的應(yīng)用就是MD5哈希值。當(dāng)利用MD5哈希值來(lái)存儲(chǔ)用戶密碼時(shí),就非常使用采用CHAR字符類型。因?yàn)槠溟L(zhǎng)度是相同的。另外,像用來(lái)存儲(chǔ)用戶的身份證號(hào)碼等等,一般也建議使用CHAR類型的數(shù)據(jù)。

另外請(qǐng)大家考慮一個(gè)問(wèn)題,CHAR(1)與VARCHAR(1)兩這個(gè)定義,會(huì)有什么區(qū)別呢?雖然這兩個(gè)都只能夠用來(lái)保存單個(gè)的字符,但是VARCHAR要比CHAR多占用一個(gè)存儲(chǔ)位置。這主要是因?yàn)槭褂肰ARCHAR數(shù)據(jù)類型時(shí),會(huì)多用1個(gè)字節(jié)用來(lái)存儲(chǔ)長(zhǎng)度信息。這個(gè)管理上的開(kāi)銷CHAR字符類型是沒(méi)有的。

三是從碎片角度進(jìn)行考慮。

使用CHAR字符型時(shí),由于存儲(chǔ)空間都是一次性分配的。為此某個(gè)字段的內(nèi)容,其都是存儲(chǔ)在一起的。單從這個(gè)角度來(lái)講,其不存在碎片的困擾。而可變長(zhǎng)度的字符數(shù)據(jù)類型,其存儲(chǔ)的長(zhǎng)度是可變的。當(dāng)其更改前后數(shù)據(jù)長(zhǎng)度不一致時(shí),就不可避免的會(huì)出現(xiàn)碎片的問(wèn)題。故使用可變長(zhǎng)度的字符型數(shù)據(jù)時(shí),數(shù)據(jù)庫(kù)管理員要時(shí)不時(shí)的對(duì)碎片進(jìn)行整理。如執(zhí)行數(shù)據(jù)庫(kù)導(dǎo)出導(dǎo)入作業(yè),來(lái)消除碎片。

四是即使使用Varchar數(shù)據(jù)類型,也不能夠太過(guò)于慷慨。

這是什么意思呢?如現(xiàn)在用戶需要存儲(chǔ)一個(gè)地址信息。根據(jù)評(píng)估,只要使用100個(gè)字符就可以了。但是有些數(shù)據(jù)庫(kù)管理員會(huì)認(rèn)為,反正Varchar數(shù)據(jù)類型是根據(jù)實(shí)際的需要來(lái)分配長(zhǎng)度的。還不如給其大一點(diǎn)的呢。為此他們可能會(huì)為這個(gè)字段一次性分配200個(gè)字符的存儲(chǔ)空間。這VARCHAR(100)與VARCHAR(200)真的相同嗎?結(jié)果是否定的。雖然他們用來(lái)存儲(chǔ)90個(gè)字符的數(shù)據(jù),其存儲(chǔ)空間相同。但是對(duì)于內(nèi)存的消耗是不同的。對(duì)于VARCHAR數(shù)據(jù)類型來(lái)說(shuō),硬盤上的存儲(chǔ)空間雖然都是根據(jù)實(shí)際字符長(zhǎng)度來(lái)分配存儲(chǔ)空間的,但是對(duì)于內(nèi)存來(lái)說(shuō),則不是。其時(shí)使用固定大小的內(nèi)存塊來(lái)保存值。簡(jiǎn)單的說(shuō),就是使用字符類型中定義的長(zhǎng)度,即200個(gè)字符空間。顯然,這對(duì)于排序或者臨時(shí)表(這些內(nèi)容都需要通過(guò)內(nèi)存來(lái)實(shí)現(xiàn))作業(yè)會(huì)產(chǎn)生比較大的不利影響。所以如果某些字段會(huì)涉及到文件排序或者基于磁盤的臨時(shí)表時(shí),分配VARCHAR數(shù)據(jù)類型時(shí)仍然不能夠太過(guò)于慷慨。還是要評(píng)估實(shí)際需要的長(zhǎng)度,然后選擇一個(gè)最長(zhǎng)的字段來(lái)設(shè)置字符長(zhǎng)度。如果為了考慮冗余,可以留10%左右的字符長(zhǎng)度。千萬(wàn)不能認(rèn)為其為根據(jù)實(shí)際長(zhǎng)度來(lái)分配存儲(chǔ)空間,而隨意的分配長(zhǎng)度,或者說(shuō)干脆使用最大的字符長(zhǎng)度。
 

 【編輯推薦】

  1. 用C++連接MySQL等數(shù)據(jù)庫(kù)一
  2. 用C++連接MySQL等數(shù)據(jù)庫(kù)二
  3. 這些SQLite與SQL差異問(wèn)題,你遇到過(guò)嗎
  4. 總結(jié)Win2003 Server與SQL Server 2005的遠(yuǎn)程連接過(guò)程
  5. 如何解決IBatis.net與MySQL連接問(wèn)題
責(zé)任編輯:艾婧 來(lái)源: ITPUB
相關(guān)推薦

2010-07-05 11:20:53

2011-08-11 13:59:52

MySQLvarchar限制規(guī)則

2010-11-26 13:18:53

MySQL字符串

2022-04-01 06:13:03

Serverless數(shù)據(jù)庫(kù)

2011-09-01 14:22:06

OracleCharVarChar

2010-05-21 10:01:11

MySQL數(shù)據(jù)庫(kù)

2021-10-01 00:02:54

CHAR VARCHARMYSQL

2016-11-11 19:46:09

數(shù)據(jù)庫(kù)OracleAWS

2024-10-30 16:12:14

2011-08-23 15:16:54

OracleMySQL

2010-06-13 10:18:08

MySQL 數(shù)據(jù)庫(kù)函數(shù)

2010-05-26 10:15:11

MySQL數(shù)據(jù)庫(kù)

2018-09-11 17:13:23

MySQ數(shù)據(jù)庫(kù)重復(fù)記錄

2011-08-10 15:46:29

數(shù)據(jù)庫(kù)

2018-05-14 16:14:56

數(shù)據(jù)庫(kù)MySQL分表與分區(qū)

2023-09-13 14:52:11

MySQL數(shù)據(jù)庫(kù)

2023-09-14 23:05:57

? ?MySQL數(shù)據(jù)庫(kù)

2011-03-28 13:25:27

MySQL數(shù)據(jù)庫(kù)哈希加密

2011-07-06 10:49:50

MySQL優(yōu)化

2010-05-25 13:17:28

MySQL數(shù)據(jù)庫(kù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)