自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

JSP和Servlet中的幾個編碼的作用及原理

開發(fā) 后端
本文介紹JSP和Servlet中的幾個編碼的作用及原理,以及Tomcat5.0為WEB服務(wù)器時,如何防止中文亂碼。

首先,說說JSP和Servlet中的幾個編碼的作用。

在JSP和Servlet中主要有以下幾個地方可以設(shè)置編碼,pageEncoding="UTF-8"、 contentType="text/html;charset=UTF-8"、request.setCharacterEncoding("UTF- 8")和response.setCharacterEncoding("UTF-8"),其中前兩個只能用于JSP中,而后兩個可以用于JSP和Servlet中。

1、pageEncoding="UTF-8"的作用是設(shè)置JSP編譯成Servlet時使用的編碼。

眾所周知,JSP在服務(wù)器上是要先被編譯成Servlet的。pageEncoding="UTF-8"的作用就是告訴JSP編譯器在將 JSP文件編譯成Servlet時使用的編碼。通常,在JSP內(nèi)部定義的字符串(直接在JSP中定義,而不是從瀏覽器提交的數(shù)據(jù))出現(xiàn)亂碼時,很多都是由于該參數(shù)設(shè)置錯誤引起的。例如,你的JSP文件是以GBK為編碼保存的,而在JSP中卻指定pageEncoding="UTF-8",就會引起JSP內(nèi)部定義的字符串為亂碼。

另外,該參數(shù)還有一個功能,就是在JSP中不指定contentType參數(shù),也不使用response.setCharacterEncoding方法時,指定對服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。

2、contentType="text/html;charset=UTF-8"的作用是指定對服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。

在不使用response.setCharacterEncoding方法時,用該參數(shù)指定對服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。

3、request.setCharacterEncoding("UTF-8")的作用是設(shè)置對客戶端請求進(jìn)行重新編碼的編碼。

該方法用來指定對瀏覽器發(fā)送來的數(shù)據(jù)進(jìn)行重新編碼(或者稱為解碼)時,使用的編碼。

4、response.setCharacterEncoding("UTF-8")的作用是指定對服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。

服務(wù)器在將數(shù)據(jù)發(fā)送到瀏覽器前,對數(shù)據(jù)進(jìn)行重新編碼時,使用的就是該編碼。

其次,要說一說瀏覽器是怎么樣對接收和發(fā)送的數(shù)據(jù)進(jìn)行編碼的

response.setCharacterEncoding("UTF-8")的作用是指定對服務(wù)器響應(yīng)進(jìn)行重新編碼的編碼。同時,瀏覽器也是根據(jù)這個參數(shù)來對其接收到的數(shù)據(jù)進(jìn)行重新編碼(或者稱為解碼)。所以在無論你在JSP中設(shè)置 response.setCharacterEncoding("UTF-8")或者 response.setCharacterEncoding("GBK"),瀏覽器均能正確顯示中文(前提是你發(fā)送到瀏覽器的數(shù)據(jù)編碼是正確的,比如正確設(shè)置了pageEncoding參數(shù)等)。讀者可以做個實驗,在JSP中設(shè)置response.setCharacterEncoding("UTF- 8"),在IE中顯示該頁面時,在IE的菜單中選擇"查看(V)"à"編碼(D)"中可以查看到是" Unicode(UTF-8)",而在在JSP中設(shè)置response.setCharacterEncoding("GBK"),在IE中顯示該頁面時,在IE的菜單中選擇"查看(V)"à"編碼(D)"中可以查看到是"簡體中文(GB2312)"。

瀏覽器在發(fā)送數(shù)據(jù)時,對URL和參數(shù)會進(jìn)行URL編碼,對參數(shù)中的中文,瀏覽器也是使 response.setCharacterEncoding參數(shù)來進(jìn)行URL編碼的。以百度和GOOGLE為例,如果你在百度中搜索"漢字",百度會將其編碼為"%BA%BA%D7%D6"。而在GOOGLE中搜索"漢字",GOOGLE會將其編碼為"%E6%B1%89%E5%AD%97",這是因為百度的response.setCharacterEncoding參數(shù)為GBK,而GOOGLE的的 response.setCharacterEncoding參數(shù)為UTF-8。

瀏覽器在接收服務(wù)器數(shù)據(jù)和發(fā)送數(shù)據(jù)到服務(wù)器時所使用的編碼是相同的,默認(rèn)情況下均為JSP頁面的 response.setCharacterEncoding參數(shù)(或者contentType和pageEncoding參數(shù)),我們稱其為瀏覽器編碼。當(dāng)然,在IE中可以修改瀏覽器編碼(在IE的菜單中選擇"查看(V)"à"編碼(D)"中修改),但通常情況下,修改該參數(shù)會使原本正確的頁面中出現(xiàn)亂碼。一個有趣的例子是,在IE中瀏覽GOOGLE的主頁時,將瀏覽器編碼修改為"簡體中文(GB2312)",此時,頁面上的中文會變成亂碼,不理它,在文本框中輸入"漢字",提交,GOOGLE會將其編碼為"%BA%BA%D7%D6",可見,瀏覽器在對中文進(jìn)行URL編碼時,使用的就是瀏覽器編碼。

弄清了瀏覽器是在接收和發(fā)送數(shù)據(jù)時,是如何對數(shù)據(jù)進(jìn)行編碼的了,我們再來看看服務(wù)器是在接收和發(fā)送數(shù)據(jù)時,是如何對數(shù)據(jù)進(jìn)行編碼的。

對于發(fā)送數(shù)據(jù),服務(wù)器按照response.setCharacterEncoding—contentType—pageEncoding的優(yōu)先順序,對要發(fā)送的數(shù)據(jù)進(jìn)行編碼。

對于接收數(shù)據(jù),要分三種情況。一種是瀏覽器直接用URL提交的數(shù)據(jù),另外兩種是用表單的GET和POST方式提交的數(shù)據(jù)。

因為各種WEB服務(wù)器對這三種方式的處理也不相同,所以我們以Tomcat5.0為例。

無論使用那種方式提交,如果參數(shù)中包含中文,瀏覽器都會使用當(dāng)前瀏覽器編碼對其進(jìn)行URL編碼。

對于表單中POST方式提交的數(shù)據(jù),只要在接收數(shù)據(jù)的JSP中正確request.setCharacterEncoding參數(shù),即將對客戶端請求進(jìn)行重新編碼的編碼設(shè)置成瀏覽器編碼,就可以保證得到的參數(shù)編碼正確。有寫讀者可能會問,那如何得到瀏覽器編碼呢?上面我們提過了,在默認(rèn)請情況下,瀏覽器編碼就是你在響應(yīng)該請求的JSP頁面中response.setCharacterEncoding設(shè)置的值。所以對于POST表單提交的數(shù)據(jù),在獲得數(shù)據(jù)的JSP頁面中request.setCharacterEncoding要和生成提交該表單的JSP頁面的 response.setCharacterEncoding設(shè)置成相同的值。

對于URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù),在接收數(shù)據(jù)的JSP中設(shè)置 request.setCharacterEncoding參數(shù)是不行的,因為在Tomcat5.0中,默認(rèn)情況下使用ISO-8859-1對URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù)進(jìn)行重新編碼(解碼),而不使用該參數(shù)對URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù)進(jìn)行重新編碼(解碼)。要解決該問題,應(yīng)該在Tomcat的配置文件的Connector標(biāo)簽中設(shè)置useBodyEncodingForURI或者URIEncoding屬性,其中 useBodyEncodingForURI參數(shù)表示是否用request.setCharacterEncoding參數(shù)對URL提交的數(shù)據(jù)和表單中 GET方式提交的數(shù)據(jù)進(jìn)行重新編碼,在默認(rèn)情況下,該參數(shù)為false(Tomcat4.0中該參數(shù)默認(rèn)為true);URIEncoding參數(shù)指定對所有GET方式請求(包括URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù))進(jìn)行統(tǒng)一的重新編碼(解碼)的編碼。URIEncoding和 useBodyEncodingForURI區(qū)別是,URIEncoding是對所有GET方式的請求的數(shù)據(jù)進(jìn)行統(tǒng)一的重新編碼(解碼),而 useBodyEncodingForURI則是根據(jù)響應(yīng)該請求的頁面的request.setCharacterEncoding參數(shù)對數(shù)據(jù)進(jìn)行的重新編碼(解碼),不同的頁面可以有不同的重新編碼(解碼)的編碼。所以對于URL提交的數(shù)據(jù)和表單中GET方式提交的數(shù)據(jù),可以修改URIEncoding 參數(shù)為瀏覽器編碼或者修改useBodyEncodingForURI為true,并且在獲得數(shù)據(jù)的JSP頁面中 request.setCharacterEncoding參數(shù)設(shè)置成瀏覽器編碼。

下面總結(jié)下,以Tomcat5.0為WEB服務(wù)器時,如何防止中文亂碼。

1、對于同一個應(yīng)用,最好統(tǒng)一編碼,推薦為UTF-8,當(dāng)然GBK也可以。

2、正確設(shè)置JSP的pageEncoding參數(shù)

3、在所有的JSP和Servlet中設(shè)置contentType="text/html;charset=UTF-8"或response.setCharacterEncoding("UTF-8"),從而間接實現(xiàn)對瀏覽器編碼的設(shè)置。

4、對于請求,可以使用過濾器或者在每個JSP和Servlet中設(shè)置 request.setCharacterEncoding("UTF-8")。同時,要修改Tomcat的默認(rèn)配置,推薦將 useBodyEncodingForURI參數(shù)設(shè)置為true,也可以將URIEncoding參數(shù)設(shè)置為UTF-8(有可能影響其他應(yīng)用,所以不推薦)。

【編輯推薦】

  1. JSP中基于Session的在線用戶統(tǒng)計分析
  2. Servlet和JSP性能優(yōu)化經(jīng)驗談
  3. JSP標(biāo)簽庫解析
  4. 在JSP Servlet開發(fā)中導(dǎo)入事件驅(qū)動技術(shù)
  5. JSP編程應(yīng)注意的六個常見問題
責(zé)任編輯:佚名 來源: builder
相關(guān)推薦

2009-06-30 17:10:28

JSP和Servlet

2009-06-30 14:51:19

JSP和Servlet

2009-07-06 15:34:56

JSP和Servlet

2009-06-25 14:26:07

JSPJavaBeanServlet

2009-07-08 09:22:03

Servlet和JSP

2009-06-30 15:37:27

Servlet和JSP

2009-07-01 17:34:03

Servlet和JSP

2009-07-06 09:23:51

Servlet定義

2009-03-02 09:45:45

2009-07-07 13:29:33

Servlet和JSP

2009-07-01 14:09:24

Servlet和BeaJSP

2009-07-02 09:13:25

什么是JSPServlet

2009-07-07 17:10:57

JSP和Servlet

2009-07-03 14:02:51

2009-07-09 10:49:56

Servlet和JSP

2009-07-07 14:04:55

JSP入門

2020-02-12 16:58:15

JavaScript前端技術(shù)

2009-07-06 15:41:14

JSP應(yīng)用

2009-07-03 11:21:43

Servlet和JSPJSP路徑

2009-08-20 17:35:47

Servlet和JSP
點贊
收藏

51CTO技術(shù)棧公眾號