自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Java Web開發(fā)中文亂碼總結(jié)

開發(fā) 后端
在開發(fā)過程中,經(jīng)常遇到中文亂碼問題,以前總是解決就好,并沒有對該問題總結(jié)一下,現(xiàn)在來總結(jié)一下開發(fā)過程中常見的中文亂碼問題。

一、有必要了解一些基本的編碼知識

這篇字符編碼筆記是必讀的

jsp的三次編碼

[[184275]]

***階段:JVM將.jsp文件編譯為.java文件。JVM先讀取pageEncoding的值,根據(jù)該值去讀取.jsp文件,然后由指定的編碼方案生成UTF-8的.java文件。

第二階段:JVM將.java文件轉(zhuǎn)換為.class文件,從UTF-8至UTF-8。這個過程就與任何編碼的設(shè)置都沒有關(guān)系了,經(jīng)過這個階段后.java文件就轉(zhuǎn)換成了統(tǒng)一的UTF-8編碼的.class文件了。

第三階段:服務(wù)器將處理的結(jié)果返回給瀏覽器,這個階段則依靠contentType的charset,如果設(shè)置了charset則瀏覽器就會使用指定的編碼格式進行解碼,否則采用默認的ISO-8859-1編碼格式進行解碼處理。

jsp中的編碼設(shè)置

pageEncoding:<%@ page pageEncoding=”UTF-8”%>

上文中***階段,使用該值去讀取jsp文件,為避免中文亂碼,跟jsp文件編碼一致;對服務(wù)器響應(yīng)進行重新編碼,即jsp的輸出流在瀏覽器中顯示的編碼(不是主要作用)。

contentType: <%@ page contentType=”text/html;charset=UTF-8”%>

使用該值對服務(wù)器響應(yīng)進行重新編碼,即jsp的輸出流在瀏覽器中顯示的編碼;對表單get和post請求數(shù)據(jù)編碼;上文中***階段,使用該值去讀取jsp文件(不是主要作用)。

< META http-equiv=”Content-Type” content=”text/html;charset=UTF-8”>

網(wǎng)頁的編碼信息 ,說明頁面制作所使用的編碼。

request.setCharacterEncoding()

可用在servlet和jsp頁面中,作用是設(shè)置對客戶端請求進行重新編碼的編碼,即post方式提交的數(shù)據(jù)進行編碼。

response.setCharacterEncoding()

與<%@ page contentType=”text/html;charset=UTF-8”%>一樣。

response.setContentType()

與<%@ page contentType=”text/html;charset=UTF-8”%>一樣。

response.setHeader(“Content-Type”,”text/html;charset=UTF-8”)

與< META http-equiv=”Content-Type” content=”text/html; charset=UTF-8”>一樣。

注意:上文1,2,3中有部分功能是一樣的,是有優(yōu)先級的,在讀取jsp文件時,1>2;在對服務(wù)器響應(yīng)進行編碼的時候,2>1>3,一般情況下,1,2都寫。

http請求默認以”ISO-8859-1”的編碼來傳送URL的。

二、中文亂碼的幾種情況及最簡單的解決方案:

pageEncoding設(shè)置錯誤

pageEncoding設(shè)置為jsp文件的編碼類型。

查詢字符串包含中文

中文的編碼方式取決于瀏覽器,chrome為UTF-8,IE為GB2312,這是由于瀏覽器并沒有遵循URI編碼規(guī)范。有兩種解決方法:

開發(fā)過程中,將查詢字符串提前編碼,

如: http://www.baidu.com/demo?demo=%D6%D0%B9%FA (UTF-8編碼)

在Servlet的doGet()方法中添加

String value = new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"瀏覽器的編碼方式");

表單中的get和post數(shù)據(jù)包含中文

中文的編碼方式取決于上文的contentType中的charset,有兩種解決辦法:

在Servlet的doPost()方法中添加request.setCharacterEncoding(“charset的值”);(僅對post有用)

在Servlet的doPost()方法中添加

String value = new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值");

三、原理

我們通過上面的方法可以解決亂碼問題,下面講講原理:

客戶端發(fā)到服務(wù)器的數(shù)據(jù)需要在客戶端進行編碼,類似于:String parameterName = "中國".getBytes("UTF-8")然后將編碼后的數(shù)據(jù)發(fā)到服務(wù)器。

客戶端接受數(shù)據(jù),request.getParameter(“”)的作用就是對接收到的數(shù)據(jù)進行解碼,默認使用ISO-8859-1進行解碼,可以使用request.setCharacterEncoding(“”)進行設(shè)置,但僅對post有用。假如我們使用默認的ISO-8859-1,肯定亂碼,因為編碼跟解碼不一致,那此時怎么辦呢,引出了上文中的兩種解決方案:使用request.setCharacterEncoding(“”)改變request.getParameter(“”)的解碼方式或者new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值")將request.getParameter(“”)解碼的數(shù)據(jù)重新編碼再解碼。

四、其他

在jsp中的頁面使用response.setContentType()等設(shè)置字符集會破壞jsp容器自身的頁面編碼,會引起html中字符亂碼,腳本不會亂,所以不建議設(shè)置。在開發(fā)中多采用page指令設(shè)置字符集。

  1. <!DOCTYPE html PUBLIC> 
  2. <html> 
  3. <head> 
  4.     <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"
  5.     <title>Insert title here</title> 
  6. </head> 
  7. <body> 
  8.     <% 
  9.         response.setContentType("text/html;charset=UTF-8"); 
  10.         String str = new String("你好".getBytes("iso-8859-1"), "utf-8"); 
  11.     %> 
  12.     <p>你好</p> 
  13.     <br><%=str%> 
  14. </body> 
  15. </html> 

 

責任編輯:張燕妮 來源: 開源中國社區(qū)
相關(guān)推薦

2009-06-19 11:16:14

java web中文亂碼

2015-06-04 10:44:59

WebAPP開發(fā)技巧

2015-06-17 10:28:10

WebAPP開發(fā)技巧

2009-09-07 18:40:28

PHP中文亂碼

2009-06-19 14:54:35

JavaMySQL中文亂碼

2010-06-03 10:26:29

開發(fā)MySQL中文亂碼

2010-05-31 18:33:00

MySQL中文亂碼

2022-04-07 15:41:36

PythonWeb 開發(fā)框

2015-04-01 10:26:32

開發(fā)中文亂碼問題

2022-04-13 18:40:59

Python開發(fā)

2009-07-06 17:50:13

Java JSP

2009-07-01 16:26:10

jsp web開發(fā)

2011-12-27 15:21:16

趕集團購Web App

2011-12-15 16:55:04

TomcatJavajsp

2010-02-22 13:53:22

Python 中文亂碼

2012-02-07 13:27:03

HibernateJava

2011-12-21 14:46:26

JavaJFreeChart

2009-11-26 16:30:52

Suse中文亂碼問題

2011-02-24 10:48:51

FireFTP

2009-06-30 17:26:56

JSP頁面
點贊
收藏

51CTO技術(shù)棧公眾號