Java web應(yīng)用中的常見字符編碼問題的解決方法
以下是 Java web應(yīng)用的常見編碼問題
1. html頁面的編碼
在web應(yīng)用中,通常瀏覽器會(huì)根據(jù)http header: Content-type的值來決定用什么encoding, 比如遇到Content-Type: text/html; charset=UTF-8, 頁面使用的就UTF-8編碼。但是考慮到離線的html(用戶可能把頁面html保存到本地), 打開離線的html的時(shí)候就要在meta指定編碼,當(dāng)然不指定也會(huì)有default值,那么不指定有時(shí)就可能出現(xiàn)亂碼。
Meta標(biāo)簽
- <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
2. Http Request的編碼
通常瀏覽在發(fā)送一個(gè)請(qǐng)求到服務(wù)器的時(shí)候,不會(huì)設(shè)置字符編碼,在服務(wù)器端為了統(tǒng)一編碼,可以在filter 中使用request.setCharacterEncoding("UTF-8")來設(shè)置編碼. 一般瀏覽器都是用默認(rèn)的ISO-8859-1字符編碼,要解決中文參數(shù)亂碼的時(shí)候都必須這一步。
3. http response的編碼
http response中可以設(shè)置輸出到瀏覽器的數(shù)據(jù)使用的編碼方法是response.setCharacterEncoding("UTF-8")和response.setContentType("text/html; charset=UTF-8"), 如果只是單純的設(shè)置編碼,***是用response.setCharacterEncoding("UTF-8"),因?yàn)閞esponse.setContentType("text/html; charset=UTF-8")是針對(duì)具體的MIME類型設(shè)置對(duì)應(yīng)的字符編碼。需要注意的是這里設(shè)置的編碼對(duì)JSP頁面不一定起作用,理由是JSP頁面有自己設(shè)置字符編碼的方式,而且優(yōu)先級(jí)更高。
4. JSP頁面的編碼
有以下三種方式, 如果同時(shí)有***種和第二種的時(shí)候只有一種會(huì)生效(如果不同的話),
還有***種和第二種會(huì)覆蓋第三種
***要注意的是在使用1)或2)聲明編碼類型時(shí),如果頁面中include了其他JSP, 對(duì)于<%@ include file="BB.jsp" %>和<jsp:include page="BB.jsp"/>的區(qū)別, 假設(shè)在AA.jsp中使用前一種方式includeBB.jsp,那么BB.jsp中就不能有重復(fù)的編碼的聲明,效果是AA.jsp和BB.jsp都使用AA.jsp中聲明的編碼方式進(jìn)行編碼。
如果是使用后一種include的方式的話,AA.jsp和BB.jsp中都可以有各自編碼的聲明。
1) <%@ page contentType="text/html;charset=UTF-8"%>
2) <%@ page pageEncoding ="charset=UTF-8"%>
3) 在web.xml中添加以下設(shè)置
- <jsp-config>
- <jsp-property-group>
- <url-pattern>*.jsp</url-pattern>
- <page-encoding>UTF-8</page-encoding>
- </jsp-property-group>
- </jsp-config>
5. web.xml和weblogic.xml中的mime的設(shè)置
在web.xml中可以指定mime映射,同時(shí)也可以指定對(duì)應(yīng)類型使用的字符編碼 (這里的設(shè)置也可以使用3中所說的http response.setContentType和response.setCharacterEncoding來做到),比如:
- <mime-mapping>
- <extension>html</extension>
- <mime-type>text/html; charset=UTF-8</mime-type>
- </mime-mapping>
在weblogic.xml中可以設(shè)置默認(rèn)的mime類型和字符編碼
- <container-discriptor>
- <default-mime-type>text/html; charset=UTF-8</default-mime-type>
- </container-discriptor>
還有
- <charset-params>
- <input-charset>
- <resource-path>/*</resource-path>
- <java-charset-name>UTF-8</java-charset-name>
- </input-charset>
- </charset-params>
總的來說,一個(gè)應(yīng)用中html, http request, http response 和jsp pages中***顯示地指定相同的字符編碼,最方便的就是都設(shè)為UTF-8,所有字符都不會(huì)出錯(cuò)。對(duì)于mime mapping的設(shè)置***是在web.xml中設(shè)置。weblogic中的關(guān)于字符編碼的設(shè)置一般不用設(shè)置(如果你把前面所說的都設(shè)置正確以后)。
原文鏈接:http://blog.csdn.net/liuhebing/article/details/7322250
【編輯推薦】