自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Java開發(fā)人員編寫SQL時常犯的十個錯誤

譯文
數(shù)據(jù)庫 SQL Server
SQL開發(fā)商Data Geeker公司首席執(zhí)行官Lukas Eder日前表示,他在博客文章列出了Java開發(fā)人員在編寫SQL時常犯的10個錯誤。

?譯者 | 李睿

審校 | 孫淑娟

SQL開發(fā)商Data Geeker公司首席執(zhí)行官Lukas Eder日前表示,他在博客文章列出了Java開發(fā)人員在編寫SQL時常犯的10個錯誤。這篇文章得到廣泛關注,這讓他感到非常驚訝。這種受歡迎程度說明了幾點:  

  • SQL對于專業(yè)的Java世界有多重要。  
  • 忘記一些基本的SQL內(nèi)容是多么常見。  
  • 以SQL為中心的庫(例如jOOQ或MyBatis)是如何通過采用SQL來響應市場需求的。

一個有趣的事實是,用戶甚至在slick的郵件列表中提到了他寫的博客文章。Slick是Scala中的一個不以SQL為中心的數(shù)據(jù)庫訪問庫。和LINQ(以及LINQ-TO-SQL)一樣,它關注的是語言集成,而不是SQL代碼生成。  

無論如何,Eder列出的一些錯誤還遠遠不夠,下面將介紹Java開發(fā)人員在編寫SQL時常犯的10個錯誤。  

1.不使用預處理語句(Prepared Statements)

有趣的是,在JDBC出現(xiàn)多年之后,這種錯誤或誤解仍然出現(xiàn)在博客、論壇和郵件列表中,即使它是關于一個在記憶和理解方面非常簡單的的事情。一些開發(fā)人員似乎因為以下原因而避免使用預處理語句:  

  • 不知道預處理語句。
  • 認為預處理語句速度較慢。  
  • 認為編寫預處理語句需要花費更多的精力。

首先需要打破以上誤區(qū)。在96%的情況下,編寫預處理語句要比編寫靜態(tài)語句更好。為什么?其原因很簡單:

  • 在內(nèi)聯(lián)綁定值時,可以省略由錯誤的字符串連接引起的語法錯誤。  
  • 當內(nèi)聯(lián)綁定值時,可以忽略由于字符串連接錯誤造成的SQL注入漏洞。  
  • 當內(nèi)聯(lián)更復雜的數(shù)據(jù)類型(如時間戳、二進制數(shù)據(jù)等)時,可以避免使用邊緣用例。  
  • 可以讓打開的預處理語句保留一段時間,用新的bind值重用它們,而不是立即關閉它們(例如,在postgres中很有用)。  
  • 可以在更復雜的數(shù)據(jù)庫中使用自適應游標共享(Oracle語言)。這有助于防止對每一組新的綁定值進行硬解析SQL語句。  

需要注意的是,在極少數(shù)情況下,確實需要內(nèi)聯(lián)綁定值,以便讓數(shù)據(jù)庫的基于成本的優(yōu)化器了解真正將受到查詢影響的數(shù)據(jù)類型。通常,這會導致“常量”謂詞,例如:  

  • deleted = 1
  • status = 42

但它不應該導致“變量”謂詞,例如:

  • first_name like “jon%”
  • amount > 19.95

需要注意的是,現(xiàn)代數(shù)據(jù)庫實現(xiàn)了綁定變量窺視。因此,在默認情況下,還可以為所有查詢參數(shù)使用綁定值。另外,在編寫嵌入式JPQL或嵌入式SQL時,諸如JPA CriteriaQuery或jOOQ等高級API將幫助您生成預處理語句并非常容易和透明地綁定值。  

解決辦法:

在默認情況下,總是使用預處理語句而不是靜態(tài)語句,并且永遠不要將綁定值內(nèi)聯(lián)到SQL中。

2.返回太多的列  

這種錯誤非常常見,可能會在數(shù)據(jù)庫的執(zhí)行計劃和Java應用程序中導致非常糟糕的影響。先看看第二個效果:

(1)對Java應用程序的不良影響

如果選擇*(星號)或50列的“默認”集合(在各種數(shù)據(jù)訪問對象之間重用),則需要將大量數(shù)據(jù)從數(shù)據(jù)庫傳輸?shù)絁DBC結(jié)果集。即使沒有從結(jié)果集中讀取數(shù)據(jù),它也已經(jīng)通過網(wǎng)絡傳輸,并由JDBC驅(qū)動程序加載到內(nèi)存中。如果知道只需要2~3個這樣的列,這相當浪費IO和內(nèi)存。  

這是顯而易見的,但也要小心。

(2)對數(shù)據(jù)庫執(zhí)行計劃的不良影響

這些影響實際上可能比對Java應用程序的影響要嚴重得多。復雜的數(shù)據(jù)庫在為查詢計算最佳執(zhí)行計劃時執(zhí)行大量SQL轉(zhuǎn)換。很可能查詢的某些部分可以被轉(zhuǎn)換掉,因為知道它們不會對投影(選擇子句)或過濾謂詞產(chǎn)生影響。

考慮一個復雜的選擇,它將連接兩個視圖:  

select *
from customer_view c
join order_view o
on c.cust_id = o.cust_id
onc.cust_id=o.cust_id

連接到上述連接表引用的每個視圖可能再次連接來自幾十個表的數(shù)據(jù),例如customeraddress、order history、order settlement等??紤]到select*投影,數(shù)據(jù)庫別無選擇,只能完全加載所有這些聯(lián)接表,而實際上,唯一感興趣的是:

select c.first_name, c.last_name, o.amount
from customer_view c
join order_view o
on c.cust_id = o.cust_id

一個出色的數(shù)據(jù)庫將以一種可以刪除大部分“隱藏”連接的方式轉(zhuǎn)換SQL,這將顯著地減少數(shù)據(jù)庫中的IO和內(nèi)存消耗。  

解決方法:

從不執(zhí)行select*。不要為不同的查詢重用相同的投影。總是嘗試減少投影到真正需要的數(shù)據(jù)。  

注意,用對象關系映射(ORM)很難實現(xiàn)這一點。  

3.認為join是select子句

這并不是一個對性能或SQL正確性有很大影響的錯誤,但是,SQL開發(fā)人員應該意識到這樣一個事實:join子句本身不是select語句的一部分。sql standard 1992這樣定義表引用:  

6.3 <table reference>
<table reference> ::=
<table name> [ [ as ] <correlation name>
[ <left paren> <derived column list> <right paren> ] ]
| <derived table> [ as ] <correlation name>
[ <left paren> <derived column list> <right paren> ]
| <joined table>

from子句和連接表可以使用這樣的表引用:  

7.4 <from clause>
<from clause> ::=
from <table reference> [ { <comma> <table reference> }... ]
7.5 <joined table>
<joined table> ::=
<cross join>
| <qualified join>
| <left paren> <joined table> <right paren>
<cross join> ::=
<table reference> cross join <table reference>
<qualified join> ::=
<table reference> [ natural ] [ <join type> ] join
<table reference> [ <join specification> ]

關系數(shù)據(jù)庫主要以表為中心。許多操作都以這樣或那樣的方式在物理表、連接表或派生表上執(zhí)行。為了有效地編寫SQL,重要的是要理解select..From子句需要一個以逗號分隔的表引用列表,無論它們以何種形式提供。  

根據(jù)表引用的復雜性,有些數(shù)據(jù)庫還接受其他語句中的復雜表引用,如插入、更新、刪除和合并。

解決方法:

始終將from子句作為一個整體來考慮表引用。如果寫一個連接子句,把這個連接子句想象成一個復雜表引用的一部分:

select c.first_name, c.last_name, o.amount
from
customer_view c
join order_view o
on c.cust_id = o.cust_id

4.使用pre-ansi連接語法  

既然已經(jīng)闡明了表引用是如何工作的,那么無論如何都要避免使用pre-ansi連接語法對于執(zhí)行計劃,如果在join..on子句或where子句中指定連接謂詞,通常沒有區(qū)別。但從可讀性和維護的角度來看,對過濾謂詞和連接謂詞都使用where子句是一個主要的障礙??紤]這個簡單的例子:

select c.first_name, c.last_name, o.amount
from customer_view c,
order_view o
where o.amount > 100
and c.cust_id = o.cust_id
and c.language = 'en'

能發(fā)現(xiàn)連接謂詞嗎?如果加入幾十張表呢?當為外部連接應用專有語法(例如oracle的(+)語法)時,情況會變得更糟。  

解決方法:

始終使用ansi-join語法。永遠不要將連接謂詞放在where子句中。使用pre-ansi連接語法絕對沒有好處。

5. 忘記轉(zhuǎn)義like謂詞的輸入

SQL標準1992指定like謂詞如下:  

8.5 <like predicate>
<like predicate> ::=
<match value> [ not ] like <pattern>
[ escape <escape character> ]

當允許在SQL查詢中使用用戶輸入時,幾乎總是應該使用escape關鍵字。雖然百分比符號(%)可能很少被認為是數(shù)據(jù)的一部分,但下劃線(_)很可能是:  

select *
from t
where t.x like 'some!_prefix%' escape '!'

解決方法: 

在使用like謂詞時,始終要考慮適當?shù)霓D(zhuǎn)義。  

6.認為not(in(x,y))是in(x、y)的布爾逆

這一點很微妙,但對于null來說非常重要!以下回顧一下in(x,y)的真正含義:

a in (x, y)
is the same as a = any (x, y)
is the same as a = x or a = y

同時, not (a in (x, y)) 真正的含義是:

not (a in (x, y))
is the same as a not in (x, y)
is the same as a != any (x, y)
is the same as a != x and a != y

這看起來像前一個謂詞的布爾逆,但實際上不是!如果x或y中的任何一個為null,則not-in謂詞將導致未知,而in謂詞可能仍然返回布爾值。

換句話說,當in(x,y)產(chǎn)生true或false時,not(a in(x、y))仍可能產(chǎn)生unknown,而不是false或true。注意,如果in謂詞的右側(cè)是子查詢,這也是正確的。

不相信嗎?看看這個sql fiddle。它表明以下查詢沒有產(chǎn)生結(jié)果:  

select 1
where 1 in (null)
union all
select 2
where not(1 in (null))

解決方法:  

當涉及nullable列時,要注意not in謂詞!

7. 認為not(a為null)與a不為null相同

人們記得SQL在處理null值時實現(xiàn)了三值邏輯。這就是為什么可以使用null謂詞來檢查null的原因。

但即使是null謂詞也很微妙。注意,以下兩個謂詞僅對度數(shù)為1的行值表達式等效: 

not (a is null)
is not the same as a is not null

如果a是一個度數(shù)大于1的行值表達式,那么真值表轉(zhuǎn)換為:

  • 只有當a中的所有值都為null時,a is null才會產(chǎn)生true  
  • 只有當a中的所有值都為null時,not(a is null)才會產(chǎn)生false
  • 只有當a中的所有值都不為null時,a is not null才會產(chǎn)生true  
  • 只有當a中的所有值都不是null時,not(a is not null) 才會產(chǎn)生false  

解決方法:  

使用行值表達式時,請注意null謂詞,它可能無法按預期工作。

8.在支持行值表達式的地方?jīng)]有使用行值表達式  

行值表達式是一個很好的SQL特性。當SQL是一種以表為中心的語言時,表也以行為中心。行值表達式通過創(chuàng)建可以與具有相同度數(shù)和行類型的其他行進行比較的本地特殊行,從而更容易地描述復雜謂詞。一個簡單的例子是同時查詢客戶的姓和名。  

select c.address
from customer c,
where (c.first_name, c.last_name) = (?, ?)
Where(c.first_name,c.last_name)=(?,?)

可以看到,這種語法比等價語法(謂詞左邊的每一列都與右邊的相應列進行比較)稍微簡潔一些。如果許多獨立謂詞與and組合在一起,則尤其如此。使用行值表達式允許將相關謂詞組合為一個謂詞。這對于復合外鍵上的連接表達式非常有用:  

select c.first_name, c.last_name, a.street
from customer c
join address a
on (c.id, c.tenant_id) = (a.id, a.tenant_id)

不幸的是,并非所有數(shù)據(jù)庫都以相同的方式支持行值表達式。但是SQL標準在1992年就已經(jīng)定義了它們,如果使用它們,像Oracle或postgres這樣復雜的數(shù)據(jù)庫可以使用它們來計算更好的執(zhí)行計劃。  

解決方法:

盡可能使用行值表達式。它們將使SQL更簡潔,甚至可能更快。  

9.沒有定義足夠的約束  

要引用TomKyte,再使用索引和Luke。元數(shù)據(jù)中不能有足夠的約束。首先,約束幫助防止數(shù)據(jù)損壞,這已經(jīng)非常有用了。但更重要的是,約束將幫助數(shù)據(jù)庫執(zhí)行SQL轉(zhuǎn)換,因為數(shù)據(jù)庫可以決定:  

  • 有些值是等價的  
  • 有些子句是多余的  
  • 某些子句是“無效的”(即它們不會返回任何值)  

一些開發(fā)人員可能認為約束是緩慢的。與其相反,除非插入大量大量的數(shù)據(jù),在這種情況下,可以禁用大型操作的約束,或者使用沒有約束的臨時“加載表”,不受約束地將數(shù)據(jù)脫機傳輸?shù)綄嶋H表。

解決方法:

定義盡可能多的約束。它們將幫助數(shù)據(jù)庫在查詢時更好地執(zhí)行。

10.認為50ms是快速查詢執(zhí)行  

對于NoSQL的炒作仍在繼續(xù),許多企業(yè)仍然認為他們是Twitter或Facebook,迫切需要更快、更可擴展的解決方案,逃避ACID和關系模型來橫向擴展。有些可能會成功(如Twitter或Facebook)。  

對于那些被迫或選擇堅持使用經(jīng)過驗證的關系數(shù)據(jù)庫的人來說,如果要和DBA相處得很好并將數(shù)據(jù)庫調(diào)到最大的話,不要誤以為現(xiàn)代數(shù)據(jù)庫很慢,事實上它們非???,并在不到一毫秒的時間內(nèi)解析20kb的查詢文本,計算2000行執(zhí)行計劃。  

它們可能會變慢,因為應用程序誤用了流行的對象關系映射(ORM),或者因為這一ORM不能為復雜的查詢邏輯生成快速SQL。在這種情況下,可能想要選擇一個更以SQL為中心的API,例如JDBC,jOOQ或MyBatis,這將重新控制SQL。

所以,不要認為50毫秒的查詢執(zhí)行速度很快,甚至可以接受。事實并非如此。如果在開發(fā)時獲得了這些速度,確保研究了執(zhí)行計劃。這些數(shù)據(jù)可能會在生產(chǎn)環(huán)境中爆發(fā)式增長,因為生產(chǎn)環(huán)境中有更復雜的場景和數(shù)據(jù)。  

結(jié)論

SQL非常有趣,但在許多方面也非常微妙。正如Eder之前關于10個常見錯誤的博客文章所表明的那樣,要做到這一點并不容易。但是SQL是可以掌握的。數(shù)據(jù)是最寶貴的資產(chǎn)。因此需要尊重數(shù)據(jù),并編寫更好的SQL。

原文標題:??10 More Common Mistakes Java Developers Make when Writing SQL??,作者:Lukas Eder?

責任編輯:華軒 來源: 51CTO
相關推薦

2015-09-21 09:34:57

2022-03-14 14:11:22

Java開發(fā)編程語言

2024-10-09 14:48:34

2023-02-26 18:43:05

SQL工具數(shù)據(jù)庫

2021-11-02 08:54:10

開發(fā)編程測試

2021-11-06 23:07:47

開發(fā)網(wǎng)站編程

2010-03-20 20:35:33

2023-05-11 16:29:39

Javascript開發(fā)前端

2019-04-24 08:56:34

Java開發(fā)人員常犯錯誤

2024-10-21 13:15:03

2023-02-27 15:44:17

Java開發(fā)技巧

2023-01-09 15:28:55

2022-12-29 08:27:03

Java開發(fā)人員編碼

2020-09-23 22:40:31

Python 開發(fā)編程語言

2024-11-04 14:18:32

JavaScript編程語言開發(fā)

2022-07-14 08:01:59

數(shù)據(jù)庫web映射器

2025-03-31 08:00:00

Django開發(fā)Python

2023-01-09 15:16:17

2022-10-17 15:33:46

前端開發(fā)數(shù)組

2024-11-08 15:22:08

點贊
收藏

51CTO技術(shù)棧公眾號