自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

什么?MySQL的等值查詢竟然出錯了?

數(shù)據(jù)庫 新聞
? 認(rèn)知有界,而求知無界。

1.問題背景

前段時間,一個業(yè)務(wù)線的小伙伴大G找過來,如下是我倆的對話。

大G:云杰,聽說你MySQL挺厲害的,我最近遇到一個奇怪問題,不知道你遇到過沒,請教你下。

我:請教不敢當(dāng),我也就是個MySQL入門級選手,說來看看。

大G:WHERE條件去等值查詢字符串,結(jié)果卻查出來幾條尾部有空格的,明明不相等。

我:不會吧?這么神奇,這個真沒遇到過!

大G:不信你試試!

我:試試就試試!

抱著求知的心態(tài),開啟了本篇的探索之旅。

2.驗證

2.1 數(shù)據(jù)準(zhǔn)備

首先在測試庫里建表,并準(zhǔn)備相關(guān)的原數(shù)據(jù)。創(chuàng)建個user_info表,分別插入'adu'(無空格)、'adu '(一個空格)、'adu    '(四個空格)三個用戶。

CREATE TABLE `user_info` (
`id` BIGINT(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '主鍵自增ID',
`user_name` VARCHAR(64) NOT NULL DEFAULT '' COMMENT '名字',

PRIMARY KEY (`id`),
KEY `idx_user_name` (`user_name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用戶表';

INSERT INTO user_info(user_name) values('adu'); #無空格
INSERT INTO user_info(user_name) values('adu '); #一個空格
INSERT INTO user_info(user_name) values('adu '); #四個空格

2.2 問題驗證

2.2.1 尾部空格驗證

SELECT * FROM user_info WHERE user_name = 'adu'; #無空格
SELECT * FROM user_info WHERE user_name = 'adu '; #一個空格
SELECT * FROM user_info WHERE user_name = 'adu '; #兩個空格
SELECT * FROM user_info WHERE user_name = 'adu '; #四個空格

我們使用如上條件去查,還真復(fù)現(xiàn)了!無論查詢中尾部帶有幾個空格,結(jié)果是一樣的,都會命中'adu'、'adu '、'adu    '三個用戶,結(jié)果如下圖所示(紅框圈起來的表示我們認(rèn)為不應(yīng)該出現(xiàn)的異常結(jié)果):

圖片

太神奇了!

2.2.2 頭部空格驗證

那如果把空格放在前面呢?再來一把,結(jié)果如下:圖片這下又匹配不上了。空格放在后邊可以,放在前邊不可以,這太神奇了?。?/p>

2.2.3 唯一索引驗證

那如果在user_name字段上建唯一索引,還能插入這三條記錄嗎?再來一把,結(jié)果如下:

圖片

也不行,被唯一索引約束住了。

2.2.4 長度驗證

那這三條記錄的user_name長度又分別是多少呢?

圖片

確實長度也不一樣。

2.3 驗證小結(jié)

從結(jié)果上來看,明明是三個長度不同的字符串,空格放在前邊被認(rèn)為是不同,放在后邊又被認(rèn)為是相同,而且唯一索引也沖突。我們有充足的理由懷疑MySQL忽略字符串尾部的空格,把'adu'、'adu '、'adu    '都當(dāng)成'adu'來處理。這確實超出了已有的認(rèn)知,那背后的原因究竟又是什么呢?

3.分析原因

查詢MySQL的官方文檔[1],原來跟字符串的校對規(guī)則有關(guān)。

圖片

原來MySQL的校對規(guī)則基于PAD SPACE,這就意味著CHAR、VARCHAR、TEXT等字符串的等值比較(“=”)會忽略掉尾部的空格,而且官網(wǎng)也說了,適用于所有MySQL版本,并且不會改變。這。。。

既然MySQL官網(wǎng)說的這么肯定,那么自信來自哪里呢?我們繼續(xù)追查SQL規(guī)范,原來SQL規(guī)范還真對這塊做了特別說明[2],如下所示:

圖片

既然規(guī)范都這樣要求了,等值查詢“=”不能精確查詢,那么到底該如何精確地進(jìn)行等值查詢呢?

4.精確查詢的方法

通過調(diào)研,我們可以通過以下兩種方式進(jìn)行精確等值查詢。

4.1 LIKE

LIKE是基于逐個字符進(jìn)行比較的,這樣就不會忽略尾部的空格,官網(wǎng)對這塊也有特別的說明。

圖片

那么我們再使用LIKE進(jìn)行等值查詢,結(jié)果還真可以!

圖片

4.2 BINARY

BINARY不是函數(shù),是類型轉(zhuǎn)換運(yùn)算符,它用來強(qiáng)制它后面的字符串轉(zhuǎn)為二進(jìn)制字節(jié),再逐個字節(jié)比較,也可以理解成精確匹配,官網(wǎng)[4]對這塊也有特別的說明。

圖片

那么我們再使用BINARY進(jìn)行等值查詢,結(jié)果也是可以的。

圖片

5.總結(jié)

  • MySQL的CHAR、VARCHAR、TEXT等字符串字段在等值比較("=")時,基于PAD SPACE校對規(guī)則,會忽略掉尾部的空格;
  • 在存儲時,不會自動截斷尾部的空格,會按原值存儲;
  • 如果想要精確查詢就不能用等值查詢("="),而應(yīng)改用LIKE或BINARY;
  • 認(rèn)知有界,而求知無界。

關(guān)于作者

杜云杰,高級架構(gòu)師,轉(zhuǎn)轉(zhuǎn)架構(gòu)部負(fù)責(zé)人,轉(zhuǎn)轉(zhuǎn)技術(shù)委員會執(zhí)行主席,騰訊云TVP。負(fù)責(zé)服務(wù)治理、MQ、云平臺、APM、IM、分布式調(diào)用鏈路追蹤、監(jiān)控系統(tǒng)、配置中心、分布式任務(wù)調(diào)度平臺、分布式ID生成器、分布式鎖等基礎(chǔ)組件。

道阻且長,擁抱變化;而困而知,且勉且行。

責(zé)任編輯:張燕妮 來源: 轉(zhuǎn)轉(zhuǎn)技術(shù)
相關(guān)推薦

2024-01-04 08:12:12

IDE代碼出錯ChatGPT

2014-07-03 14:04:55

Bug報告Bug

2012-05-18 13:23:02

iPhone 4S

2015-12-07 14:11:01

2020-04-07 11:15:03

Zoom加密網(wǎng)絡(luò)安全

2010-05-12 18:10:26

MySQL出錯代碼

2022-05-30 07:57:06

密態(tài)等值查詢數(shù)據(jù)庫

2024-12-02 08:01:47

加鎖高并發(fā)程序

2011-05-16 10:16:19

MYSQL出錯代碼

2021-08-16 12:32:37

HashMap八股文面試

2015-07-20 15:26:56

WiFi感知

2022-02-24 07:48:47

MySQL索引查詢

2010-05-13 11:05:56

2024-01-08 08:23:07

Go語言代碼

2021-05-08 15:41:06

計算機(jī)互聯(lián)網(wǎng) 技術(shù)

2022-03-21 08:07:21

計費(fèi)系統(tǒng)開發(fā)

2020-07-06 14:16:22

Fastjson漏洞開源

2019-06-26 10:16:52

微軟Windows谷歌

2023-06-13 10:01:48

SpringOpenFeign

2019-10-23 08:45:34

SQL數(shù)據(jù)庫開發(fā)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號