不同的數(shù)據(jù)庫平臺(tái),如何取前百分之N的記錄?
本文轉(zhuǎn)載自微信公眾號(hào)「SQL數(shù)據(jù)庫開發(fā)」,作者丶平凡世界。轉(zhuǎn)載本文請(qǐng)聯(lián)系SQL數(shù)據(jù)庫開發(fā)公眾號(hào)。
最近幫業(yè)務(wù)部門梳理業(yè)務(wù)報(bào)表,其中有個(gè)需求是就算某指標(biāo)等待時(shí)間最長的前百分之十,其實(shí)就是對(duì)等待時(shí)長進(jìn)行倒序排序后,取結(jié)果集的前百分之十。
這個(gè)需求在SQL Server和Oracle上都很容易實(shí)現(xiàn),甚至是在MySQL 8.0也很容易實(shí)現(xiàn),只是恰好我們業(yè)務(wù)數(shù)據(jù)庫是MySQL 5.7
先給大家介紹下不同數(shù)據(jù)庫平臺(tái)的實(shí)現(xiàn)方法。
SQL Server實(shí)現(xiàn)方法
SQL Server上有個(gè)TOP Percent的方法可以直接取結(jié)果的前(或后)百分之N
例如有如下一張City表
我們?nèi)∏?0%的數(shù)據(jù)記錄可以這樣寫:
- SELECT
- TOP 10 PERCENT
- *
- FROM City
- ORDER BY ID DESC
結(jié)果如下:
Oracle實(shí)現(xiàn)方法
Oracle有個(gè)ROWNUM偽列可以用來幫助我們計(jì)算前百分之N。
ROWNUM偽列的特點(diǎn):
- ROWNUM是按照記錄插入時(shí)的順序排序的
- ROWNUM并不實(shí)際存在,是對(duì)篩選后的結(jié)果集的一個(gè)排序,如果不存在結(jié)果集就不會(huì)有ROWNUM
- ROWNUM不能用基表名作為前綴
- 在使用ROWNUM進(jìn)行查詢時(shí),請(qǐng)注意:
1)若使用大于號(hào)(>),則只能使用(>0),其他均不可以
2)若使用小于號(hào)(<),同一般情況
3)若使用等于號(hào)(=),則只能使用等于1(=1)
我們可以先計(jì)算出整個(gè)表的記錄行數(shù)量
- SELECT COUNT(*) CNT FROM City
然后根據(jù)count聚合查詢總條數(shù)乘以百分比,來確定要查詢的條數(shù)
- SELECT 0.1*COUNT(*) CNT FROM City
最后取出偽列小于共有數(shù)據(jù)的百分比的數(shù)據(jù)
- SELECT * FROM CITY
- WHERE ID IN
- (
- SELECT ID FROM
- (
- SELECT ID FROM CITY ORDER BY ID DESC
- )
- WHERE ROWNUM < (SELECT COUNT(*)*0.1 FROM CITY)
- )
注意:Oracle不支持子查詢內(nèi)ORDER BY,需要在外面再嵌套一層。
MySQL 8.0的實(shí)現(xiàn)方法
MySQL 8.0的實(shí)現(xiàn)方法主要是借助窗口函數(shù)ROW_NUMBER() OVER()。
其實(shí)就是給排好序的集合添加一個(gè)自增長列,與Oracle的ROWNUM有點(diǎn)類似
- SELECT * FROM
- (
- SELECT *,
- ROW_NUMBER() OVER(ORDER BY ID DESC) rn
- FROM City
- ORDER BY ID DESC
- ) a
- WHERE a.rn<=(SELECT 0.1*COUNT(*) FROM City)
MySQL 5.X的實(shí)現(xiàn)方法
我們知道MySQL 5.X是沒有開窗函數(shù)ROW_NUMBER() OVER()的,那該如何實(shí)現(xiàn)呢?
這里我們需要借助變量來實(shí)現(xiàn),其實(shí)思路還是創(chuàng)建一個(gè)自增長列,只是方法不同。
- SELECT
- A.*,
- @row_num:=@row_num+1 AS ROW_NUM
- FROM
- City A , (SELECT @row_num:=0) B
- ORDER BY ID DESC
這樣我們就可以得到一張有自增長列的結(jié)果集了,接下來還是按照上面類似的方法,取前10%即可。
- SELECT * FROM
- (
- SELECT
- A.*,
- @row_num:=@row_num+1 AS ROW_NUM
- FROM
- City A , (SELECT @row_num:=0) B
- ORDER BY ID DESC
- ) C
- WHERE C.ROW_NUM<=(@row_num*0.1)
其實(shí)MySQL 5.X也挺簡單的,只是當(dāng)時(shí)不怎么想用變量,想看看有沒有其他辦法,最后發(fā)現(xiàn)還是得用變量圖片
以上就是不同平臺(tái)的數(shù)據(jù)庫求前百分之N的方法了,代碼可以驗(yàn)證一下收藏起來留著下次直接套用。
總結(jié)
其中有涉及一些知識(shí)點(diǎn),需要小伙伴們自己去進(jìn)一步了解:
- SQL Server的TOP PERCENT
- Oracle的ROWNUM,子查詢排序
- ROW_NUMBER() OVER()
- MySQL的變量