MySQL中字符串函數(shù)詳細(xì)介紹
符串或串(String)是由零個(gè)或多個(gè)字符組成的有限序列。一般記為 s='a1a2•••an'(n>=0)。它是編程語言中表示文本的數(shù)據(jù)類型。
通常以串的整體作為操作對(duì)象,如:在串中查找某個(gè)子串、求取一個(gè)子串、在串的某個(gè)位置上插入一個(gè)子串以及刪除一個(gè)子串等。兩個(gè)字符串相等的充要條件是:長度相等,并且各個(gè)對(duì)應(yīng)位置上的字符都相等。設(shè)p、q是兩個(gè)串,求q在p中首次出現(xiàn)的位置的運(yùn)算叫做模式匹配。串的兩種最基本的存儲(chǔ)方式是順序存儲(chǔ)方式和鏈接存儲(chǔ)方式。
下面我們來看看MySQL中的字符串函數(shù)
假如結(jié)果的長度大于 max_allowed_packet 系統(tǒng)變量的最大值時(shí),字符串值函數(shù)的返回值為NULL。
對(duì)于在字符串位置操作的函數(shù),第一個(gè)位置的編號(hào)為 1。
◆ ASCII(str)
返回值為字符串str 的最左字符的數(shù)值。假如str為空字符串,則返回值為 0 。假如str 為NULL,則返回值為 NULL。 ASCII()用于帶有從 0到255的數(shù)值的字符。
mysql> SELECT ASCII('2'); -> 50 mysql> SELECT ASCII(2); -> 50 mysql> SELECT ASCII('dx'); -> 100 |
見 ORD()函數(shù)。
◆ BIN(N)
返回值為N的二進(jìn)制值的字符串表示,其中 N 為一個(gè)longlong (BIGINT) 數(shù)字。這等同于 CONV(N,10,2)。假如N 為NULL,則返回值為 NULL。
mysql> SELECT BIN(12); |
◆ BIT_LENGTH(str)
返回值為二進(jìn)制的字符串str 長度。
mysql> SELECT BIT_LENGTH('text'); |
◆ CHAR(N,... [USING charset])
CHAR()將每個(gè)參數(shù)N理解為一個(gè)整數(shù),其返回值為一個(gè)包含這些整數(shù)的代碼值所給出的字符的字符串。NULL值被省略。
mysql> SELECT CHAR(77,121,83,81,'76'); |
大于 255的CHAR()參數(shù)被轉(zhuǎn)換為多結(jié)果字符。 例如,CHAR(256) 相當(dāng)于 CHAR(1,0), 而CHAR(256*256) 則相當(dāng)于 CHAR(1,0,0):
mysql> SELECT HEX(CHAR(1,0)), HEX(CHAR(256)); |
CHAR()的返回值為一個(gè)二進(jìn)制字符串。可選擇使用USING語句產(chǎn)生一個(gè)給出的字符集中的字符串:
mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8)); |
如果 USING已經(jīng)產(chǎn)生,而結(jié)果字符串不符合給出的字符集,則會(huì)發(fā)出警告。同樣,如果嚴(yán)格的SQL模式被激活,則CHAR()的結(jié)果會(huì)成為 NULL。
◆ CHAR_LENGTH(str)
返回值為字符串str 的長度,長度的單位為字符。一個(gè)多字節(jié)字符算作一個(gè)單字符。對(duì)于一個(gè)包含五個(gè)二字節(jié)字符集, LENGTH()返回值為 10, 而CHAR_LENGTH()的返回值為5。
◆ CHARACTER_LENGTH(str)
CHARACTER_LENGTH()是CHAR_LENGTH()的同義詞。
◆ COMPRESS(string_to_compress)
壓縮一個(gè)字符串。這個(gè)函數(shù)要求 MySQL已經(jīng)用一個(gè)諸如zlib的壓縮庫壓縮過。 否則,返回值始終是NULL。UNCOMPRESS() 可將壓縮過的字符串進(jìn)行解壓縮。
mysql> SELECT LENGTH(COMPRESS(REPEAT('a',1000))); |
壓縮后的字符串的內(nèi)容按照以下方式存儲(chǔ):
空字符串按照空字符串存儲(chǔ)。
非空字符串未壓縮字符串的四字節(jié)長度進(jìn)行存儲(chǔ)(首先為低字節(jié)),后面是壓縮字符串。如果字符串以空格結(jié)尾,就會(huì)在后加一個(gè)"."號(hào),以防止當(dāng)結(jié)果值是存儲(chǔ)在CHAR或VARCHAR類型的字段列時(shí),出現(xiàn)自動(dòng)把結(jié)尾空格去掉的現(xiàn)象。(不推薦使用 CHAR 或VARCHAR 來存儲(chǔ)壓縮字符串。最好使用一個(gè) BLOB 列代替)。
#p#
◆ CONCAT(str1,str2,...)
返回結(jié)果為連接參數(shù)產(chǎn)生的字符串。如有任何一個(gè)參數(shù)為NULL ,則返回值為 NULL?;蛟S有一個(gè)或多個(gè)參數(shù)。 如果所有參數(shù)均為非二進(jìn)制字符串,則結(jié)果為非二進(jìn)制字符串。 如果自變量中含有任一二進(jìn)制字符串,則結(jié)果為一個(gè)二進(jìn)制字符串。一個(gè)數(shù)字參數(shù)被轉(zhuǎn)化為與之相等的二進(jìn)制字符串格式;若要避免這種情況,可使用顯式類型 cast, 例如: SELECT CONCAT(CAST(int_col AS CHAR), char_col)
mysql> SELECT CONCAT('My', 'S', 'QL'); |
◆ CONCAT_WS(separator,str1,str2,...)
CONCAT_WS() 代表 CONCAT With Separator ,是CONCAT()的特殊形式。 第一個(gè)參數(shù)是其它參數(shù)的分隔符。分隔符的位置放在要連接的兩個(gè)字符串之間。分隔符可以是一個(gè)字符串,也可以是其它參數(shù)。如果分隔符為 NULL,則結(jié)果為 NULL。函數(shù)會(huì)忽略任何分隔符參數(shù)后的 NULL 值。
mysql> SELECT CONCAT_WS(',','First name','Second name','Last Name'); |
CONCAT_WS()不會(huì)忽略任何空字符串。 (然而會(huì)忽略所有的 NULL)。
◆ CONV(N,from_base,to_base)
不同數(shù)基間轉(zhuǎn)換數(shù)字。返回值為數(shù)字的N字符串表示,由from_base基轉(zhuǎn)化為 to_base 基。如有任意一個(gè)參數(shù)為NULL,則返回值為 NULL。自變量 N 被理解為一個(gè)整數(shù),但是可以被指定為一個(gè)整數(shù)或字符串。最小基數(shù)為 2 ,而最大基數(shù)則為 36。 If to_base 是一個(gè)負(fù)數(shù),則 N 被看作一個(gè)帶符號(hào)數(shù)。否則, N 被看作無符號(hào)數(shù)。 CONV() 的運(yùn)行精確度為 64比特。
mysql> SELECT CONV('a',16,2); |
◆ ELT(N,str1,str2,str3,...)
若N = 1,則返回值為 str1 ,若N = 2,則返回值為 str2 ,以此類推。若N 小于1或大于參數(shù)的數(shù)目,則返回值為 NULL 。 ELT() 是 FIELD()的補(bǔ)數(shù)。
mysql> SELECT ELT(1, 'ej', 'Heja', 'hej', 'foo'); |
◆ EXPORT_SET(bits,on,off[,separator[,number_of_bits]])
返回值為一個(gè)字符串,其中對(duì)于bits值中的每個(gè)位組,可以得到一個(gè) on 字符串,而對(duì)于每個(gè)清零比特位,可以得到一個(gè)off 字符串。bits 中的比特值按照從右到左的順序接受檢驗(yàn) (由低位比特到高位比特)。字符串被分隔字符串分開(默認(rèn)為逗號(hào)‘,’),按照從左到右的順序被添加到結(jié)果中。number_of_bits 會(huì)給出被檢驗(yàn)的二進(jìn)制位數(shù) (默認(rèn)為 64)。
mysql> SELECT EXPORT_SET(5,'Y','N',',',4); |
◆ FIELD(str,str1,str2,str3,...)
返回值為str1, str2, str3,……列表中的str 指數(shù)。在找不到str 的情況下,返回值為 0 。
如果所有對(duì)于FIELD() 的參數(shù)均為字符串,則所有參數(shù)均按照字符串進(jìn)行比較。如果所有的參數(shù)均為數(shù)字,則按照數(shù)字進(jìn)行比較。否則,參數(shù)按照雙倍進(jìn)行比較。
如果str 為NULL,則返回值為0 ,原因是NULL不能同任何值進(jìn)行同等比較。FIELD() 是ELT()的補(bǔ)數(shù)。
mysql> SELECT FIELD('ej', 'Hej', 'ej', 'Heja', 'hej', 'foo'); |
◆ FIND_IN_SET(str,strlist)
假如字符串str 在由N 子鏈組成的字符串列表strlist 中, 則返回值的范圍在 1 到 N 之間 。一個(gè)字符串列表就是一個(gè)由一些被‘,’符號(hào)分開的自鏈組成的字符串。如果第一個(gè)參數(shù)是一個(gè)常數(shù)字符串,而第二個(gè)是type SET列,則 FIND_IN_SET() 函數(shù)被優(yōu)化,使用比特計(jì)算。如果str不在strlist 或strlist 為空字符串,則返回值為 0 。如任意一個(gè)參數(shù)為NULL,則返回值為 NULL。 這個(gè)函數(shù)在第一個(gè)參數(shù)包含一個(gè)逗號(hào)(‘,’)時(shí)將無法正常運(yùn)行。
mysql> SELECT FIND_IN_SET('b','a,b,c,d'); |
◆ FORMAT(X,D)
將number X設(shè)置為格式 '#,###,###.##', 以四舍五入的方式保留到小數(shù)點(diǎn)后D位, 而返回結(jié)果為一個(gè)字符串。
◆ HEX(N_or_S)
如果N_OR_S 是一個(gè)數(shù)字,則返回一個(gè) 十六進(jìn)制值 N 的字符串表示,在這里, N 是一個(gè)longlong (BIGINT)數(shù)。這相當(dāng)于 CONV(N,10,16)。
如果N_OR_S 是一個(gè)字符串,則返回值為一個(gè)N_OR_S的十六進(jìn)制字符串表示, 其中每個(gè)N_OR_S 里的每個(gè)字符被轉(zhuǎn)化為兩個(gè)十六進(jìn)制數(shù)字。
mysql> SELECT HEX(255); |
#p#
◆ INSERT(str,pos,len,newstr)
返回字符串 str, 其子字符串起始于 pos 位置和長期被字符串 newstr取代的len 字符。 如果pos 超過字符串長度,則返回值為原始字符串。 假如len的長度大于其它字符串的長度,則從位置pos開始替換。若任何一個(gè)參數(shù)為null,則返回值為NULL。
mysql> SELECT INSERT('Quadratic', 3, 4, 'What'); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ INSTR(str,substr)
返回字符串 str 中子字符串的第一個(gè)出現(xiàn)位置。這和LOCATE()的雙參數(shù)形式相同,除非參數(shù)的順序被顛倒。
mysql> SELECT INSTR('foobarbar', 'bar'); |
這個(gè)函數(shù)支持多字節(jié)字元,并且只有當(dāng)至少有一個(gè)參數(shù)是二進(jìn)制字符串時(shí)區(qū)分大小寫。
◆ LCASE(str)
LCASE() 是 LOWER()的同義詞。
◆ LEFT(str,len)
返回從字符串str 開始的len 最左字符。
mysql> SELECT LEFT('foobarbar', 5); |
◆ LENGTH(str)
返回值為字符串str 的長度,單位為字節(jié)。一個(gè)多字節(jié)字符算作多字節(jié)。這意味著 對(duì)于一個(gè)包含5個(gè)2字節(jié)字符的字符串, LENGTH() 的返回值為 10, 而 CHAR_LENGTH()的返回值則為5。
mysql> SELECT LENGTH('text'); |
◆ LOAD_FILE(file_name)
讀取文件并將這一文件按照字符串的格式返回。 文件的位置必須在服務(wù)器上,你必須為文件制定路徑全名,而且你還必須擁有FILE 特許權(quán)。文件必須可讀取,文件容量必須小于 max_allowed_packet字節(jié)。
若文件不存在,或因不滿足上述條件而不能被讀取, 則函數(shù)返回值為 NULL。
mysql> UPDATE tbl_name |
◆ LOCATE(substr,str) , LOCATE(substr,str,pos)
第一個(gè)語法返回字符串 str中子字符串substr的第一個(gè)出現(xiàn)位置。第二個(gè)語法返回字符串 str中子字符串substr的第一個(gè)出現(xiàn)位置, 起始位置在pos。如若substr 不在str中,則返回值為0。
mysql> SELECT LOCATE('bar', 'foobarbar'); |
這個(gè)函數(shù)支持多字節(jié)字元,并且只有當(dāng)至少有一個(gè)參數(shù)是二進(jìn)制字符串時(shí)區(qū)分大小寫。
◆ LOWER(str)
返回字符串 str 以及所有根據(jù)最新的字符集映射表變?yōu)樾懽帜傅淖址?(默認(rèn)為 cp1252 Latin1)。
mysql> SELECT LOWER('QUADRATICALLY'); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ LPAD(str,len,padstr)
返回字符串 str, 其左邊由字符串padstr 填補(bǔ)到len 字符長度。假如str 的長度大于len, 則返回值被縮短至 len 字符。
mysql> SELECT LPAD('hi',4,'??'); |
◆ LTRIM(str)
返回字符串 str ,其引導(dǎo)空格字符被刪除。
mysql> SELECT LTRIM(' barbar'); |
這個(gè)函數(shù)支持多字節(jié)字元。
#p#
◆ MAKE_SET(bits,str1,str2,...)
返回一個(gè)設(shè)定值 (一個(gè)包含被‘,’號(hào)分開的字字符串的字符串) ,由在bits 組中具有相應(yīng)的比特的字符串組成。str1 對(duì)應(yīng)比特 0, str2 對(duì)應(yīng)比特1,以此類推。str1, str2, ...中的 NULL值不會(huì)被添加到結(jié)果中。
mysql> SELECT MAKE_SET(1,'a','b','c'); |
◆ MID(str,pos,len)
MID(str,pos,len) 是 SUBSTRING(str,pos,len)的同義詞。
◆ OCT(N)
返回一個(gè) N的八進(jìn)制值的字符串表示,其中 N 是一個(gè)longlong (BIGINT)數(shù)。這等同于CONV(N,10,8)。若N 為 NULL ,則返回值為NULL。
mysql> SELECT OCT(12); |
◆ OCTET_LENGTH(str)
OCTET_LENGTH() 是 LENGTH()的同義詞。
◆ ORD(str)
若字符串str 的最左字符是一個(gè)多字節(jié)字符,則返回該字符的代碼, 代碼的計(jì)算通過使用以下公式計(jì)算其組成字節(jié)的數(shù)值而得出:
(1st byte code) |
假如最左字符不是一個(gè)多字節(jié)字符,那么 ORD()和函數(shù)ASCII()返回相同的值。
mysql> SELECT ORD('2'); |
◆ POSITION(substr IN str)
POSITION(substr IN str)是 LOCATE(substr,str)同義詞。
◆ QUOTE(str)
引證一個(gè)字符串,由此產(chǎn)生一個(gè)在SQL語句中可用作完全轉(zhuǎn)義數(shù)據(jù)值的結(jié)果。 返回的字符串由單引號(hào)標(biāo)注,每例都帶有單引號(hào) (‘'’)、 反斜線符號(hào) (‘\’)、 ASCII NUL以及前面有反斜線符號(hào)的Control-Z 。如果自變量的值為NULL, 則返回不帶單引號(hào)的單詞 “NULL”。
mysql> SELECT QUOTE('Don\'t!'); |
◆ REPEAT(str,count)
返回一個(gè)由重復(fù)的字符串str 組成的字符串,字符串str的數(shù)目等于count 。若 count <= 0,則返回一個(gè)空字符串。若str 或 count 為 NULL,則返回 NULL 。
mysql> SELECT REPEAT('MySQL', 3); |
◆ REPLACE(str,from_str,to_str)
返回字符串str 以及所有被字符串to_str替代的字符串from_str 。
mysql> SELECT REPLACE('www.mysql.com', 'w', 'Ww'); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ REVERSE(str)
返回字符串 str ,順序和字符順序相反。
mysql> SELECT REVERSE('abc'); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ RIGHT(str,len)
從字符串str 開始,返回最右len 字符。
mysql> SELECT RIGHT('foobarbar', 4); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ RPAD(str,len,padstr)
返回字符串str, 其右邊被字符串 padstr填補(bǔ)至len 字符長度。假如字符串str 的長度大于 len,則返回值被縮短到與 len 字符相同長度。
mysql> SELECT RPAD('hi',5,'?'); |
這個(gè)函數(shù)支持多字節(jié)字元。
#p#
◆ RTRIM(str)
返回字符串 str ,結(jié)尾空格字符被刪去。
mysql> SELECT RTRIM('barbar '); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ SOUNDEX(str)
從str返回一個(gè)soundex字符串。 兩個(gè)具有幾乎同樣探測的字符串應(yīng)該具有同樣的 soundex 字符串。一個(gè)標(biāo)準(zhǔn)的soundex 字符串的長度為4個(gè)字符,然而SOUNDEX() 函數(shù)會(huì)返回一個(gè)人以長度的字符串。 可使用結(jié)果中的SUBSTRING() 來得到一個(gè)標(biāo)準(zhǔn) soundex 字符串。在str中,會(huì)忽略所有未按照字母順序排列的字符。 所有不在A-Z范圍之內(nèi)的國際字母符號(hào)被視為元音字母。
mysql> SELECT SOUNDEX('Hello'); |
注意:這個(gè)函數(shù)執(zhí)行原始的Soundex算法,而非更加流行的加強(qiáng)版本(如D. Knuth所述)。其區(qū)別在于原始版本首先會(huì)刪去元音,其次是重復(fù),而加強(qiáng)版則首先刪去重復(fù),而后刪去元音。
◆ expr1 SOUNDS LIKE expr2
這相當(dāng)于SOUNDEX(expr1) = SOUNDEX(expr2)。
◆ SPACE(N)
返回一個(gè)由N 間隔符號(hào)組成的字符串。
mysql> SELECT SPACE(6); |
◆ SUBSTRING(str,pos) , SUBSTRING(str FROM pos) SUBSTRING(str,pos,len) , SUBSTRING(str FROM pos FOR len)
不帶有l(wèi)en 參數(shù)的格式從字符串str返回一個(gè)子字符串,起始于位置 pos。帶有l(wèi)en參數(shù)的格式從字符串str返回一個(gè)長度同len字符相同的子字符串,起始于位置 pos。 使用 FROM的格式為標(biāo)準(zhǔn) SQL 語法。也可能對(duì)pos使用一個(gè)負(fù)值。假若這樣,則子字符串的位置起始于字符串結(jié)尾的pos 字符,而不是字符串的開頭位置。在以下格式的函數(shù)中可以對(duì)pos 使用一個(gè)負(fù)值。
mysql> SELECT SUBSTRING('Quadratically',5); |
這個(gè)函數(shù)支持多字節(jié)字元。
注意,如果對(duì)len使用的是一個(gè)小于1的值,則結(jié)果始終為空字符串。
SUBSTR()是 SUBSTRING()的同義詞。
◆ SUBSTRING_INDEX(str,delim,count)
在定界符 delim 以及count 出現(xiàn)前,從字符串str返回自字符串。若count為正值,則返回最終定界符(從左邊開始)左邊的一切內(nèi)容。若count為負(fù)值,則返回定界符(從右邊開始)右邊的一切內(nèi)容。
mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', 2); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ TRIM([{BOTH | LEADING | TRAILING} [remstr] FROM] str) TRIM(remstr FROM] str)
返回字符串 str , 其中所有remstr 前綴和/或后綴都已被刪除。若分類符BOTH、LEADIN或TRAILING中沒有一個(gè)是給定的,則假設(shè)為BOTH 。 remstr 為可選項(xiàng),在未指定情況下,可刪除空格。
mysql> SELECT TRIM(' bar '); |
這個(gè)函數(shù)支持多字節(jié)字元。
◆ UCASE(str)
UCASE()是UPPER()的同義詞。
◆ UNCOMPRESS(string_to_uncompress)
對(duì)經(jīng)COMPRESS()函數(shù)壓縮后的字符串進(jìn)行解壓縮。若參數(shù)為壓縮值,則結(jié)果為 NULL。這個(gè)函數(shù)要求 MySQL 已被諸如zlib 之類的壓縮庫編譯過。否則, 返回值將始終是 NULL。
mysql> SELECT UNCOMPRESS(COMPRESS('any string')); |
◆ UNCOMPRESSED_LENGTH(compressed_string)
返回壓縮字符串壓縮前的長度。
mysql> SELECT UNCOMPRESSED_LENGTH(COMPRESS(REPEAT('a',30))); |
◆ UNHEX(str)
執(zhí)行從HEX(str)的反向操作。就是說,它將參數(shù)中的每一對(duì)十六進(jìn)制數(shù)字理解為一個(gè)數(shù)字,并將其轉(zhuǎn)化為該數(shù)字代表的字符。結(jié)果字符以二進(jìn)制字符串的形式返回。
mysql> SELECT UNHEX('4D7953514C'); |
◆ UPPER(str)
返回字符串str, 以及根據(jù)最新字符集映射轉(zhuǎn)化為大寫字母的字符 (默認(rèn)為cp1252 Latin1).
mysql> SELECT UPPER('Hej'); |
該函數(shù)支持多字節(jié)字元。
【編輯推薦】