自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

數(shù)據(jù)庫 其他數(shù)據(jù)庫
這里有幾個(gè)關(guān)鍵詞;“熟悉”、“陌生”、“編程語言”。說它“熟悉”,是因?yàn)樗荄BA和廣大開發(fā)人員,操作數(shù)據(jù)庫的主要手段,幾乎每天都在使用。說它“陌生”,是很多人只是簡單的使用它,至于它是怎么工作的?如何才能讓它更高效的工作?卻從來沒有考慮過。

 一、SQL :一種熟悉又陌生的編程語言

這里有幾個(gè)關(guān)鍵詞;“熟悉”、“陌生”、“編程語言”。

說它“熟悉”,是因?yàn)樗荄BA和廣大開發(fā)人員,操作數(shù)據(jù)庫的主要手段,幾乎每天都在使用。說它“陌生”,是很多人只是簡單的使用它,至于它是怎么工作的?如何才能讓它更高效的工作?卻從來沒有考慮過。

[[271147]]

這里把SQL歸結(jié)為一種“編程語言”,可能跟很多人對(duì)它的認(rèn)知不同。讓我們看看它的簡單定義(以下內(nèi)容摘自百度百科)

結(jié)構(gòu)化查詢語言(Structured Query Language),簡稱SQL,是一種特殊目的的編程語言,是一種數(shù)據(jù)庫查詢和程序設(shè)計(jì)語言,用于存取數(shù)據(jù)以及查詢、更新和管理關(guān)系數(shù)據(jù)庫系統(tǒng)。結(jié)構(gòu)化查詢語言是高級(jí)的非過程化編程語言,允許用戶在高層數(shù)據(jù)結(jié)構(gòu)上工作。它不要求用戶指定對(duì)數(shù)據(jù)的存放方法,也不需要用戶了解具體的數(shù)據(jù)存放方式,所以具有完全不同底層結(jié)構(gòu)的不同數(shù)據(jù)庫系統(tǒng), 可以使用相同的結(jié)構(gòu)化查詢語言作為數(shù)據(jù)輸入與管理的接口。結(jié)構(gòu)化查詢語言語句可以嵌套,這使它具有極大的靈活性和強(qiáng)大的功能。

總結(jié)一句話,SQL是一種非過程化的的編程語言,可通過它去訪問關(guān)系型數(shù)據(jù)庫系統(tǒng)。

二、你真的了解“SQL”嗎?

下面我會(huì)通過一個(gè)小例子,看看大家是否真正了解SQL。

 

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

 

這是一個(gè)很簡單的示例,是關(guān)于SQL語句執(zhí)行順序的。這里將一個(gè)普通的SELECT語句,拆分為三個(gè)子句。那么在實(shí)際的執(zhí)行過程中,是按照什么順序處理的呢?這里有A-F六個(gè)選項(xiàng),大家可以思考選擇一下…

最終的答案是D,即按照先執(zhí)行FROM子句,然后WHERE子句,最后是SELECT部分。

 

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

 

針對(duì)上面的示例,讓我們真實(shí)構(gòu)造一個(gè)場景,通過查看執(zhí)行計(jì)劃看看是否按照我們選擇的順序執(zhí)行的。關(guān)于執(zhí)行計(jì)劃的判讀,我后面會(huì)專門談到。這里我先解釋一下整個(gè)執(zhí)行過程。

第一步,是按照全表掃描的方式訪問了對(duì)象表(EMP)。對(duì)應(yīng)于語句中的FROM部分。

第二步,是對(duì)提取出的結(jié)果集進(jìn)行了過濾(filter部分),即將滿足條件的記錄篩選出來。對(duì)應(yīng)于語句中的WHERE部分。

第三步,是對(duì)滿足條件的記錄進(jìn)行字段投射,即將需要顯示的字段提取出來。對(duì)應(yīng)于語句中的SELECT部分。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

這是一個(gè)詳細(xì)的SQL各部分執(zhí)行順序的說明。

通過對(duì)執(zhí)行順序的理解,可以為我們未來的優(yōu)化工作帶來很大幫助。一個(gè)很淺顯的認(rèn)識(shí)就是,優(yōu)化動(dòng)作越靠前越好。

三、SQL現(xiàn)在是否仍然重要?

這里引入了一個(gè)新的問題,在現(xiàn)有階段SQL語言是否還重要?

之所以引入這一話題,是因?yàn)殡S著NOSQL、NEWSQL、BIGDATA等技術(shù)逐步成熟推廣,“SQL語言在現(xiàn)階段已經(jīng)變得不那么重要”成為一些人的觀點(diǎn)。那實(shí)際情況又是如何呢?、

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

讓我們先來看一張經(jīng)典的圖。圖中描述了傳統(tǒng)SMP架構(gòu)的關(guān)系型數(shù)據(jù)庫、MPP架構(gòu)的NEWSQL、MPP架構(gòu)的NoSQL不同方案的適用場景對(duì)比。

從上面的“數(shù)據(jù)價(jià)值密度、實(shí)時(shí)性”來看,傳統(tǒng)關(guān)系型數(shù)據(jù)庫適合于價(jià)值密度更高、實(shí)時(shí)性要求更高的場景(這也就不難理解類似賬戶、金額類信息都是保存在傳統(tǒng)關(guān)系型數(shù)據(jù)庫中);MPP架構(gòu)的NewSQL次之,MPP架構(gòu)的NoSQL更適合于低價(jià)值、實(shí)時(shí)性要求不高的場景。

從下面的“數(shù)據(jù)規(guī)模”來看,傳統(tǒng)關(guān)系型數(shù)據(jù)庫適合保存的大小限制在TB級(jí)別,而后兩者可在更大尺度上(PB、EB)級(jí)保存數(shù)據(jù)。

從下面的“典型場景”來看,傳統(tǒng)關(guān)系型數(shù)據(jù)庫適合于OLTP在線交易系統(tǒng);MPP架構(gòu)的NewSQL適合于OLAP在線分析系統(tǒng);而NoSQL的使用場景較多(利于KV型需求、數(shù)據(jù)挖掘等均可以考慮)。

最后從“數(shù)據(jù)特征”來看,前兩者適合于保存結(jié)構(gòu)化數(shù)據(jù),后者更適合于半結(jié)構(gòu)化、乃至非結(jié)構(gòu)化數(shù)據(jù)的保存。

歸納一下,不同技術(shù)有其各自特點(diǎn),不存在誰代替誰的問題。傳統(tǒng)關(guān)系型數(shù)據(jù)庫有其自身鮮明特點(diǎn),在某些場合依然是不二選擇。而作為其主要交互語言,SQL必然長期存在發(fā)展下去。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

我們?cè)賮韺?duì)比一下傳統(tǒng)數(shù)據(jù)庫與大數(shù)據(jù)技術(shù)。從數(shù)據(jù)量、增長型、多樣化、價(jià)值等維度對(duì)比兩種技術(shù),各自有其適用場景。

對(duì)于大數(shù)據(jù)領(lǐng)域而言,各種技術(shù)層出不窮。但對(duì)于廣大使用者來說,往往會(huì)存在一定的使用門檻,因此現(xiàn)在的一種趨勢就是在大數(shù)據(jù)領(lǐng)域也引入“類SQL”,以類似SQL的方式訪問數(shù)據(jù)。這對(duì)于廣大使用者來說,無疑大大降低了使用門檻。

解答一些疑問:

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

NoSQL、NewSQL已經(jīng)超越了傳統(tǒng)數(shù)據(jù)庫,SQL沒有了用武之地!

各種技術(shù)有著各自適合的不同場景,不能一概而論。SQL語言作為關(guān)系型數(shù)據(jù)庫的主要訪問方式,依然有其用武之地。

以后都是云時(shí)代了,誰還用關(guān)系型數(shù)據(jù)庫!

對(duì)于價(jià)值密度高,嚴(yán)格一致性的場景,仍然適合采用關(guān)系型數(shù)據(jù)庫作為解決方案。

我編程都是用OR Mapping工具,從不需要寫SQL!

的確,引入OR Mapping工具大大提高了生產(chǎn)效率,但是它的副作用也很明顯,那就是對(duì)語句的運(yùn)行效率失去了控制。很多低效的語句,往往是通過工具直接生成的。這也是為什么有的Mapping工具還提供了原始的SQL接口,用來保證關(guān)鍵語句的執(zhí)行效率。

大數(shù)據(jù)時(shí)代,我們都用Hadoop、Spark了,不用寫SQL啦!

無論是使用Hadoop、Spark都是可以通過編寫程序完成數(shù)據(jù)分析的,但其生產(chǎn)效率往往很低。這也是為什么產(chǎn)生了Hive 、Spark SQL等“類SQL”的解決方案來提高生產(chǎn)效率。

數(shù)據(jù)庫處理能力很強(qiáng),不用太在意SQL性能!

的確,隨著多核CPU、大內(nèi)存、閃存等硬件技術(shù)的發(fā)展,數(shù)據(jù)庫的處理能力較以前有了很大的增強(qiáng)。但是SQL的性能依然很重要。后面我們可以看到,一個(gè)簡單SQL語句就可以輕易地搞垮一個(gè)數(shù)據(jù)庫。

SQL優(yōu)化,找DBA就行了,我就不用學(xué)了!

SQL優(yōu)化是DBA的職責(zé)范疇,但對(duì)于開發(fā)人員來講,更應(yīng)該對(duì)自己的代碼負(fù)責(zé)。如果能在開發(fā)階段就注重SQL質(zhì)量,會(huì)避免很多低級(jí)問題。

我只是個(gè)運(yùn)維DBA,SQL優(yōu)化我不行!

DBA的發(fā)展可分為“運(yùn)維DBA->開發(fā)DBA->數(shù)據(jù)架構(gòu)師…”。如果只能完成數(shù)據(jù)庫的運(yùn)維類工作,無疑是技能的欠缺,也是對(duì)各人未來發(fā)展不利。況且,隨著Paas云的逐步推廣,對(duì)于數(shù)據(jù)庫的運(yùn)維需求越來越少,對(duì)于優(yōu)化、設(shè)計(jì)、架構(gòu)的要求越來越多。因此,SQL優(yōu)化是每個(gè)DBA必須掌握的技能。

現(xiàn)在優(yōu)化有工具了,很簡單的!

的確現(xiàn)在有些工具可以為我們減少些優(yōu)化分析工作,會(huì)自動(dòng)給出一些優(yōu)化建議。但是,作為DBA來講,不僅要知其然,還要知其所以然。況且,數(shù)據(jù)庫優(yōu)化器本身就是一個(gè)非常復(fù)雜的組件,很難做到完全無誤的優(yōu)化,這就需要人工的介入,分析。

優(yōu)化不就是加索引嘛,這有啥!

的確,加索引是一個(gè)非常常用的優(yōu)化手段,但其不是唯一的。且很多情況下,加了索引可能導(dǎo)致性能更差。后面,會(huì)有一個(gè)案例說明。

四、SQL仍然很重要!

 SQL:一種熟悉又陌生的編程語言,你了解他嗎?

我們通過一個(gè)示例,說明一下理解SQL運(yùn)行原理仍然很重要。

這是我在生產(chǎn)環(huán)境碰到的一個(gè)真實(shí)案例。Oracle數(shù)據(jù)庫環(huán)境,兩個(gè)表做關(guān)聯(lián)。執(zhí)行計(jì)劃觸目驚心,優(yōu)化器評(píng)估返回的數(shù)據(jù)量為3505T條記錄,計(jì)劃返回量127P字節(jié),總成本9890G,返回時(shí)間999:59:59。

從執(zhí)行計(jì)劃中可見,兩表關(guān)聯(lián)使用了笛卡爾積的關(guān)聯(lián)方式。我們知道笛卡爾連接是指在兩表連接沒有任何連接條件的情況。一般情況下應(yīng)盡量避免笛卡爾積,除非某些特殊場合。否則再強(qiáng)大的數(shù)據(jù)庫,也無法處理。這是一個(gè)典型的多表關(guān)聯(lián)缺乏連接條件,導(dǎo)致笛卡爾積,引發(fā)性能問題的案例。

從案例本身來講,并沒有什么特別之處,不過是開發(fā)人員疏忽,導(dǎo)致了一條質(zhì)量很差的SQL。但從更深層次來講,這個(gè)案例可以給我們帶來如下啟示:

開發(fā)人員的一個(gè)疏忽,造成了嚴(yán)重的后果,原來數(shù)據(jù)庫竟是如此的脆弱。需要對(duì)數(shù)據(jù)庫保持一種"敬畏"之心。

電腦不是人腦,它不知道你的需求是什么,只能用寫好的邏輯進(jìn)行處理。

不要去責(zé)怪開發(fā)人員,誰都會(huì)犯錯(cuò)誤,關(guān)鍵是如何從制度上保證不再發(fā)生類似的問題。

五、SQL優(yōu)化法則

下面我們來看看常見的優(yōu)化法則。這里所說的優(yōu)化法則,其實(shí)是指可以從那些角度去考慮SQL優(yōu)化的問題。可以有很多種方式去看待它。下面列舉一二。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

這里來自阿里-葉正盛的一篇博客里的一張圖,相信很多人都看過。這里提出了經(jīng)典的漏斗優(yōu)化法則,高度是指我們投入的資源,寬度是指可能實(shí)現(xiàn)的收益。從圖中可見,“減少數(shù)據(jù)訪問”是投入資源最少,而收益較多的方式;“增加硬件資源”是相對(duì)投入資源最多,而收益較少的一種方式。受時(shí)間所限,這里不展開說明了。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

這是我總結(jié)的一個(gè)優(yōu)化法則,簡稱為“DoDo”法則。

第一條,“Do Less or not do!”翻譯過來,就是盡量讓數(shù)據(jù)庫少做工作、甚至不做工作。

怎么樣來理解少做工作呢?比如創(chuàng)建索引往往可以提高訪問效率,其原理就是將原來的表掃描轉(zhuǎn)換為索引掃描,通過一個(gè)有序的結(jié)構(gòu),只需要少量的IO訪問就可以得到相應(yīng)的數(shù)據(jù),因此效率才比較高。這就可以歸納為少做工作。

怎么樣來理解不做工作呢?比如在系統(tǒng)設(shè)計(jì)中常見的緩存設(shè)計(jì),很多是將原來需要訪問數(shù)據(jù)庫的情況,改為訪問緩存即可。這樣既提高了訪問效率,又減少了數(shù)據(jù)庫的壓力。從數(shù)據(jù)庫角度來說,這就是典型的不做工作。

第二條,“If must do,do it fast!”翻譯過來,如果數(shù)據(jù)庫必須做這件事件,那么請(qǐng)盡快做完它。

怎么樣來理解這句話呢?比如數(shù)據(jù)庫里常見的并行操作,就是通過引入多進(jìn)程來加速原來的執(zhí)行過程。加速處理過程,可以少占用相關(guān)資源,提高系統(tǒng)整體吞吐量。

六、SQL 執(zhí)行過程

SQL的執(zhí)行過程比較復(fù)雜,不同數(shù)據(jù)庫有一定差異。下面介紹以兩種主流的數(shù)據(jù)庫(Oracle、MySQL)介紹一下。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

用戶提交了一條SQL語句

數(shù)據(jù)庫按照SQL語句的字面值計(jì)算出一個(gè)HASH值

根據(jù)HASH值,判斷一下在數(shù)據(jù)庫緩沖區(qū)中是否存在此SQL的執(zhí)行計(jì)劃。

如果不存在,則需要生成一個(gè)執(zhí)行計(jì)劃(硬解析過程),然后將結(jié)果存入緩沖區(qū)。

如果存在的話,判斷是否為相同SQL(同樣HASH值的語句,可能字符不相同;即使完全相同,也可能代表不同的語句。這塊不展開說了)

確認(rèn)是同一條SQL語句,則從緩沖區(qū)中取出執(zhí)行計(jì)劃。

將執(zhí)行計(jì)劃,交給執(zhí)行器執(zhí)行。

結(jié)果返回給客戶端。

 

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

 

客戶提交一條語句

現(xiàn)在查詢緩存查看是否存在對(duì)應(yīng)的緩存數(shù)據(jù),如有則直接返回(一般有的可能性極小,因此一般建議關(guān)閉查詢緩存)。

交給解析器處理,解析器會(huì)將提交的語句生成一個(gè)解析樹。

預(yù)處理器會(huì)處理解析樹,形成新的解析樹。這一階段存在一些SQL改寫的過程。

改寫后的解析樹提交給查詢優(yōu)化器。查詢優(yōu)化器生成執(zhí)行計(jì)劃。

執(zhí)行計(jì)劃交由執(zhí)行引擎調(diào)用存儲(chǔ)引擎接口,完成執(zhí)行過程。這里要注意,MySQL的Server層和Engine層是分離的。

最終的結(jié)果有執(zhí)行引擎返回給客戶端,如果開啟查詢緩存的話,則會(huì)緩存。

七、SQL優(yōu)化器

在上面的執(zhí)行過程描述中,多次提高了優(yōu)化器。它也是數(shù)據(jù)庫中最核心的組件。下面我們來介紹一下優(yōu)化器。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

上面是我對(duì)優(yōu)化器的一些認(rèn)識(shí)。優(yōu)化器是數(shù)據(jù)庫的精華所在,值得DBA去認(rèn)真研究。但是遺憾的是,數(shù)據(jù)庫對(duì)這方面的開放程度并不夠。(相對(duì)來說,Oracle還是做的不錯(cuò)的)

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

這里我們看到的MySQL的優(yōu)化器的工作過程,大致經(jīng)歷了如下處理:

詞法分析、語法分析、語義檢查

預(yù)處理階段(查詢改寫等)

查詢優(yōu)化階段(可詳細(xì)劃分為邏輯優(yōu)化、物理優(yōu)化兩部分)

查詢優(yōu)化器優(yōu)化依據(jù),來自于代價(jià)估算器估算結(jié)果(它會(huì)調(diào)用統(tǒng)計(jì)信息作為計(jì)算依據(jù))

交由執(zhí)行器執(zhí)行

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

此圖是DBAplus社群MySQL原創(chuàng)專家李海翔對(duì)比不同數(shù)據(jù)庫優(yōu)化器技術(shù)所總結(jié)的。從這里可以看出:

不同數(shù)據(jù)庫的實(shí)現(xiàn)層次不同,有些支持、有些不支持

即使支持,其實(shí)現(xiàn)原理也差異很大

這只是列出了一小部分優(yōu)化技術(shù)

以上對(duì)比,也可以解釋不同數(shù)據(jù)庫對(duì)同樣語句的行為不同。下面會(huì)有一個(gè)示例說明

八、SQL 執(zhí)行計(jì)劃

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

看懂執(zhí)行計(jì)劃是DBA優(yōu)化的前提之一,它為我們開啟一扇通往數(shù)據(jù)庫內(nèi)部的窗口。但是很遺憾,從沒有一本書叫做“如何看懂執(zhí)行計(jì)劃”,這里的情況非常復(fù)雜,很多是需要DBA常年積累而成。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?

這是Oracle執(zhí)行計(jì)劃簡單的示例,說明了執(zhí)行計(jì)劃的大致內(nèi)容。

SQL:一種熟悉又陌生的編程語言,你了解他嗎?
責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2021-07-26 06:57:58

系統(tǒng)CSS Content

2024-03-15 08:18:25

volatileAtomic關(guān)鍵字

2022-02-09 07:40:42

JavaScript前端面試題

2020-07-10 10:48:51

編程語言JavaPython

2010-01-25 15:09:17

C++語言

2018-08-21 13:50:05

編程語言JavaPython

2023-07-18 18:10:04

2012-11-01 13:41:25

編程語言BasicPerl

2015-12-23 10:00:04

多種編程語言

2012-02-01 10:18:23

編程

2013-03-12 14:07:06

Java編程

2018-03-12 13:32:02

編程語言程序員語言

2010-11-04 10:55:24

編程語言

2017-11-13 12:01:31

開發(fā)者編程編程風(fēng)格

2020-10-27 15:01:25

編程語言PythonJava

2012-03-14 11:46:30

ibmdw

2012-03-19 10:45:44

ibmdw

2018-03-07 09:42:07

2010-01-21 16:24:02

C++語言

2015-08-31 09:27:21

語言界面UI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)