MySQL編碼機(jī)制與亂碼
以下的文章主要是向大家描述的是MySQL編碼機(jī)制, 我們大家都知道從 MySQL4.1 版本開(kāi)始,其支持很多種編碼,包括 latin1、gbk、utf8、big5 等等,當(dāng)然還有一些我們聞所未聞的,以下就是具體內(nèi)容的描述。
在使用 PHP 連接 MySQL 查詢出來(lái)的數(shù)據(jù)有的時(shí)候居然會(huì)是亂碼,關(guān)于亂碼的解決首先我們要了解MySQL編碼機(jī)制。
拿 Discuz! 論壇為例,Discuz! 論壇在連接 MySQL 后會(huì)立即執(zhí)行一個(gè)設(shè)定(見(jiàn)include/db_mysql.class.php ):
復(fù)制內(nèi)容到剪貼板Code:
@mysql_query("SET character_set_connection=$dbcharset, character_set_results=$dbcharset, character_set_client=binary", $this->link); 此三處的字符設(shè)定很大程度上會(huì)解決亂碼問(wèn)題,那么這三個(gè)設(shè)定具體有什么作用呢?如果我們了解了MySQL編碼機(jī)制,就可以避免在安裝插件及平時(shí)的操作過(guò)程中產(chǎn)生亂碼,還可以自行對(duì)論壇的數(shù)據(jù)進(jìn)行轉(zhuǎn)碼。
character_set_client 我們可以理解為 SQL 語(yǔ)句的編碼,如果設(shè)置為 binary,MySQL 就當(dāng)二進(jìn)制來(lái)處理,character_set_connection 設(shè)定的值則告訴 MySQL 用來(lái)運(yùn)行 SQL 語(yǔ)句的時(shí)候使用的編碼,也就是說(shuō),程序發(fā)送給 MySQL 的 SQL 語(yǔ)句,會(huì)首先被 MySQL 從 character_set_client 指定的編碼轉(zhuǎn)換到 character_set_connection 指定的編碼,如果 character_set_clien 指定的是 binary ,則 MySQL 就會(huì)把 SQL 語(yǔ)句按照 character_set_connection 指定的編碼解釋執(zhí)行。
當(dāng)執(zhí)行 SQL 語(yǔ)句的過(guò)程中,比如向數(shù)據(jù)庫(kù)中插入取出數(shù)據(jù)的時(shí)候,字段也有編碼設(shè)置,如果字段的編碼設(shè)置和 character_set_connection 指定的不同,則 MySQL 會(huì)把插入的數(shù)據(jù)轉(zhuǎn)換成字段設(shè)定的編碼。
當(dāng) SQL 執(zhí)行完畢向客戶端返回?cái)?shù)據(jù)的時(shí)候,會(huì)把數(shù)據(jù)從字段指定的編碼轉(zhuǎn)換為 character_set_results 指定的編碼,如果 character_set_results=NULL 則不做任何轉(zhuǎn)換動(dòng)作,(注意這里設(shè)置為 NULL 不等于沒(méi)有設(shè)置,沒(méi)有設(shè)置的時(shí)候 MySQL 會(huì)繼承全局設(shè)置)。
了解了MySQL編碼機(jī)制,我們就可以利用這個(gè)機(jī)制進(jìn)行數(shù)據(jù)的轉(zhuǎn)碼以及避免在程序使用過(guò)程中出現(xiàn)亂碼了。
補(bǔ)充:
mysql_query("character_set_client=gbk"); 這句告訴 MySQL 我接下來(lái)要用的 SQL 語(yǔ)句的編碼是 GBK 的
mysql_query("character_set_connection=gbk"); 這句 告訴 MySQL 要把 SQL 語(yǔ)句轉(zhuǎn)換成 GBK 進(jìn)行處理
mysql_query("character_set_results=gbk"); 這句告訴 MYSQL 查詢返回的結(jié)果要統(tǒng)一都轉(zhuǎn)換成 GBK 編碼的
【編輯推薦】