MySQL自定義變量?學(xué)不廢不收費~
相信大家對join,where 以及子查詢等等操作已經(jīng)非常熟悉,在此基礎(chǔ)上如果對于mysql的用戶自定義變量再熟練掌握了,那么對于數(shù)據(jù)分析來說就又多了一個工具。雖然這個功能不是經(jīng)常用,但是學(xué)來擴(kuò)展一下自己的知識庫也是好的,免得書到用時方恨少。今天有機(jī)會請到了自定義變量本量來給大家現(xiàn)場說法,咱天就嘮叨嘮叨自定義變量是個啥,是咋工作的。
1.自定義變量---自我介紹
大家好,我是mysql自定義變量,和其他的自定義變量一樣,你們可以把我當(dāng)作一個小盒子,如果想要召喚我只要大喊一聲
set @ver:='x'
就可以召喚出自定義變量本量,順便把x放裝進(jìn)了盒子。
當(dāng)然我除了可以裝x,
還可以裝b,心中默念 set @ver:='b' 就可以裝逼成功
如果心情不好我還可以啥也不裝
比如set @ver:=0
如果召喚我請珍惜我,因為我在一次mysql鏈接中有效。
不要以為我只能散裝,把我安裝在生產(chǎn)線上照樣能行。
比如某條sql生產(chǎn)出來一個指標(biāo)需要存一下,只需要把結(jié)果into我就行了,具體操作如下:
select count(1) into @ver from table
想跟裝進(jìn)去的東西確認(rèn)眼神么?select @ver,馬上告訴你盒子里現(xiàn)在裝了個啥
我一般不會單獨存在,而是內(nèi)嵌到sql語句里面作為一個存儲中間變量的容器,如果想知道和我sql語句之間是怎么配合的,就不得不了解一下我的小老弟---sql
2,SQL的自我簡介
大家好,我是SQL,是一種數(shù)據(jù)庫操作的工具,也是自定義變量的好大哥。如果能配合EXCEL來了解我,就會發(fā)現(xiàn)我不是一個慢熱的人。能動手咱就不bb,舉個栗子讓你看一下我們倆有多像
栗子如下:
- select
- id
- from
- (select id from table1 ) a
- join
- (select id from table2) b
- on a.id=b.id
- where a.id>=100
- order by id
首先我要執(zhí)行子查詢,也就是把a和b兩個中間表搞出來(ab兩個表可以理解為excle的兩個sheet)
然后我再執(zhí)行join語句,對兩個表根據(jù)id進(jìn)行笛卡爾乘積,得到兩個表的全部信息(主鍵唯一的情況下可以理解為excel的vlookup)
當(dāng)然有些信息并不是我們需要的,怎么過濾呢,用where語句(相當(dāng)于excel的篩選功能)
最終以order by 對最終結(jié)果進(jìn)行排序(對應(yīng)excel的排序功能)
下面說一點細(xì)節(jié)可以加深我和自定義標(biāo)量之間的合作方式
當(dāng)我select 想要的列時候(select id from table)可以看成是讀取了一列id,也可以看成是一行一行讀取id列,每取一條記錄,游標(biāo)往下走一格,當(dāng)遍歷完所有的數(shù)據(jù)之后再呈現(xiàn)給我們一列id。按照第二種方式相當(dāng)于是python遍歷數(shù)組,中間自然可以加一些變量來存儲一些數(shù)據(jù)。
有點抽象?舉個例子~
3,舉幾個栗子
某個數(shù)據(jù)表格記錄了AB兩個店每個小時的營業(yè)額,原始數(shù)據(jù)如下
- CREATE TABLE `wk_test` (
- `date` varchar(20) NOT NULL COMMENT '日期',
- `shop` varchar(255) NOT NULL COMMENT '商店',
- `hour` int(11) NOT NULL COMMENT '小時',
- `income` int(11) NOT NULL COMMENT '收入',
- PRIMARY KEY (`date`,`shop`,`hour`)
- ) ENGINE=InnoDB DEFAULT CHARSET=utf8
1.如何觀察每天某個時間點A,B兩個店的分別的累計營業(yè)額?
按照上面所說的原理,如果每讀出一條記錄相當(dāng)于游標(biāo)往下走一下,我們在遍歷數(shù)據(jù)的過程中用變量對中間結(jié)果進(jìn)行記錄和判斷,那么就能實現(xiàn)上述需求,代碼如下:
- --初始化變量
- set @cosum:=0;
- set @dates:='';
- set @shop:='';
- select
- date,shop,hour,income,
- @group_income:=
- --判斷是否是同一天的同一個商店
- case when @dates=a.date and @shop=a.shop
- --是一個則累加
- then @cosum:=@cosum+income
- --不是則將第一個小時的值賦值給累加量
- else @cosum:=a.income
- end as group_income,
- --保存當(dāng)前用于判斷的變量
- @dates:=a.date,
- @shop:=a.shop
- from
- (select * from wk_test order by date,shop,hour) a
結(jié)果如下:

2.用自定義變量實現(xiàn)row_number()over 開窗mysq不支持開窗函數(shù),但是引入自定義變量就能實現(xiàn)相同的效果,具體實現(xiàn)代碼如下:
- set @row_number:=0;
- set @dates:='';
- set @shop:='';
- select
- date,shop,hour,income,
- @num:=case when @dates=a.date and @shop=a.shop
- then @row_number:=@row_number+1
- else @row_number:=1
- end as group_income,
- @dates:=a.date,
- @shop:=a.shop
- from
- (select * from wk_test order by date,shop,hour) a
結(jié)果如下:

4,后記:
Mysql的自定義變量是一個不太常用的功能,因為大數(shù)據(jù)基本上是存儲在hadoop上,操作一般用hive,spark或者impala,他們都自帶一些開窗函數(shù)在一定程度上可以取代自定義變量。但是如果懂自定義變量有可能會解決一些不太好解決的問題。
你學(xué)廢了么?