自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MySQL去除“關(guān)聯(lián)表”重復(fù)數(shù)據(jù),以建立聯(lián)合唯一索引

數(shù)據(jù)庫 MySQL
昨天遇到一個(gè)問題,需要對一張關(guān)系表進(jìn)行重構(gòu)和優(yōu)化。然而這張關(guān)系表由于已有代碼沒有注重并發(fā)導(dǎo)致了很多的臟數(shù)據(jù),即重復(fù)數(shù)據(jù)。解決辦法:使用insert where not exists語句和清理臟數(shù)據(jù)并建立聯(lián)合唯一索引。

前言

昨天遇到一個(gè)問題,需要對一張關(guān)系表進(jìn)行重構(gòu)和優(yōu)化。然而這張關(guān)系表由于已有代碼沒有注重并發(fā)導(dǎo)致了很多的臟數(shù)據(jù),即重復(fù)數(shù)據(jù)。

表名thread_recommend,帖子推薦表,為兩個(gè)實(shí)體user_id和thread_id的(推薦)關(guān)系表,表結(jié)構(gòu)很簡單如下: 

  1. /*用戶推薦帖子記錄表*/ 
  2.  
  3. CREATE TABLE `thread_recommend` ( 
  4.  
  5. `id` int(11) NOT NULL AUTO_INCREMENT, 
  6.  
  7. `thread_id` int(11) DEFAULT NULL COMMENT '被用戶推薦的帖子編號'
  8.  
  9. `user_id` int(11) DEFAULT NULL COMMENT '推薦該帖子的用戶編號'
  10.  
  11. `status` int(11) DEFAULT '1' COMMENT '狀態(tài)0 取消推薦,1推薦'
  12.  
  13. `created` TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '推薦時(shí)間'
  14.  
  15. PRIMARY KEY (`id`), 
  16.  
  17. KEY `userid` (`user_id`) USING BTREE 
  18.  
  19. ) ENGINE=InnoDB; 

 問題在于,由于代碼不規(guī)范,在高并發(fā)時(shí)(或數(shù)據(jù)庫壓力大時(shí)造成的延時(shí)積壓時(shí))會(huì)出現(xiàn)多個(gè)(相同thread_id和user_id的)組合,如下:

 

之后你們懂的,各種和原想不一致的神奇bug噴涌而出,比如:

我剛剛?cè)∠送扑],怎么還顯示我推薦著!!

顯示的總推薦數(shù)怎么和實(shí)際推薦用戶加起來不一樣!!

解決方案一:使用insert where not exists語句

聲明:此方案并不是***方案,不推薦使用。

先上代碼:(這里拿另一個(gè)關(guān)系表的真實(shí)query舉例,原理一樣) 

  1. INSERT INTO `user_topic` (`user_id`, `topic_id`) 
  2.  
  3. SELECT :userId, :topicid FROM `user_topic` 
  4.  
  5. WHERE NOT EXISTS (SELECT * FROM `user_topic` 
  6.  
  7. WHERE `user_topic`.`user_id` = :userId 
  8.  
  9. AND `user_topic`.`topic_id` = :topicid) 
  10.  
  11. LIMIT 1;  

(相同方法見http://stackoverflow.com/a/31...)

通過這種“插入時(shí)判斷不存在才插入并返回行數(shù)為1,存在的話返回行數(shù)為0”的方法,可以做到:

  • 只有在返回行數(shù)為1的情況下才執(zhí)行之后邏輯(如緩存內(nèi)的統(tǒng)計(jì)數(shù)+1,緩存內(nèi)帖子推薦人增加此userId等等)
  • 如果返回行數(shù)為0,則接口返回error

解決方案二:清理臟數(shù)據(jù)并建立聯(lián)合唯一索引

這個(gè)方案是本文的核心了,也是我們目前認(rèn)為的***實(shí)踐。

***步:查找user_id, thread_id的聯(lián)合duplication 

  1. SELECT a.* FROM `thread_recommend` a 
  2.  
  3. INNER JOIN (SELECT * FROM `thread_recommend` GROUP BY `thread_id`, `user_id` HAVING COUNT(id) > 1) b ON a.`thread_id` = b.`thread_id` AND a.`user_id` = b.`user_id` 
  4.  
  5. ORDER BY a.`user_id` ASC, a.`thread_id` ASC, a.`id` DESC  

或簡單的版本 

  1. SELECT * FROM `thread_recommend` 
  2.  
  3. WHERE (`user_id`, `thread_id`) IN (SELECT `user_id`, `thread_id` FROM `thread_recommend` GROUP BY `user_id`, `thread_id` HAVING COUNT(1) > 1);  

得到

 

哇!所有的重復(fù)項(xiàng)都在這里了,好想馬上把它們干掉!

現(xiàn)在需要將重復(fù)的條目中ID更大的所有條目都刪除,只留ID最小的那一個(gè)。

刪之前先獲得需要?jiǎng)h除項(xiàng),比對一下,

  1. SELECT * FROM `thread_recommend` 
  2.  
  3. WHERE (`user_id`, `thread_id`) IN (SELECT `user_id`, `thread_id` FROM `thread_recommend` GROUP BY `user_id`, `thread_id` HAVING COUNT(1) > 1) 
  4.  
  5. AND `id` NOT IN (SELECT MIN(`id`) FROM `thread_recommend` GROUP BY `user_id`, `thread_id` HAVING COUNT(1) > 1);  

下一步,SELECT * FROM改成DELETE FROM,刪除!

  1. DELETE FROM `thread_recommend` 
  2.  
  3. WHERE (`user_id`, `thread_id`) IN (SELECT `user_id`, `thread_id` FROM `thread_recommend` GROUP BY `user_id`, `thread_id` HAVING COUNT(1) > 1) 
  4.  
  5. AND `id` NOT IN (SELECT MIN(`id`) FROM `thread_recommend` GROUP BY `user_id`, `thread_id` HAVING COUNT(1) > 1);  

Oops!報(bào)錯(cuò)! You can't specify target table 'thread_recommend' for update in FROM clause

這是Mysql的一個(gè)小問題,我們參見解決方案 http://stackoverflow.com/a/14... 后修改一下SQL就好:

  1. DELETE FROM `thread_recommend` 
  2.  
  3. WHERE (`user_id`, `thread_id`) IN (SELECT `user_id`, `thread_id` FROM (SELECT * FROM `thread_recommend`) a GROUP BY `user_id`, `thread_id` HAVING COUNT(1) > 1) 
  4.  
  5. AND `id` NOT IN (SELECT MIN(`id`) FROM (SELECT * FROM `thread_recommend`) b GROUP BY `user_id`, `thread_id` HAVING COUNT(1) > 1);  

***,加聯(lián)合唯一索引!

  1. ALTER TABLE `thread_recommend` 
  2.  
  3. ADD UNIQUE KEY `thread_id_user_id_unique`(`thread_id`,`user_id`) USING BTREE;  

Of course,如果上述清理工作沒有完成將會(huì)報(bào)錯(cuò)!

完!

責(zé)任編輯:龐桂玉 來源: segmentfault
相關(guān)推薦

2024-08-19 09:43:00

2022-08-04 08:22:49

MySQL索引

2023-01-03 07:44:53

MySQL查詢重復(fù)

2024-03-26 12:16:13

MySQLInnodb數(shù)據(jù)庫

2019-10-21 09:55:12

數(shù)據(jù)庫PostgreSQL Oracle

2023-02-26 00:00:06

MySQL索引故障

2024-03-11 05:00:00

Python集合開發(fā)

2021-04-08 10:55:53

MySQL數(shù)據(jù)庫代碼

2011-04-13 13:05:14

重復(fù)數(shù)據(jù)刪除

2010-09-02 10:36:51

SQL刪除

2011-08-02 12:46:46

Oracle數(shù)據(jù)表建立索引

2021-11-30 10:00:01

SQL數(shù)據(jù)重復(fù)

2024-05-24 09:29:28

2011-08-18 11:18:25

Oracle唯一約束唯一索引

2025-01-24 00:00:00

數(shù)據(jù)RoaringBitmap

2021-06-28 10:25:47

MySQL數(shù)據(jù)庫重復(fù)數(shù)據(jù)

2023-11-14 14:41:01

數(shù)據(jù)庫清除

2021-09-14 13:15:43

MySQL數(shù)據(jù)庫腳本

2011-04-13 13:13:09

重復(fù)數(shù)據(jù)刪除

2024-10-16 17:04:13

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號