自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="39jju"></cite>

<style id="39jju"></style>

<sub id="39jju"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

談?wù)刉EB開發(fā)中的苦大難字符集問題

作者：佚名 2013-08-29 11:05:49

開發(fā) 前端

記得剛做javaweb開發(fā)的時(shí)候被這個(gè)編碼問題搞得暈頭轉(zhuǎn)向，經(jīng)常稀里糊涂的編碼正常了一會(huì)編碼又亂了。那個(gè)時(shí)候迫于項(xiàng)目進(jìn)度大多都是知其然不知其所以然。后來有時(shí)間就把整個(gè)體系搞了個(gè)遍，終于摸通了來龍去脈。

記得剛做javaweb開發(fā)的時(shí)候被這個(gè)編碼問題搞得暈頭轉(zhuǎn)向，經(jīng)常稀里糊涂的編碼正常了一會(huì)編碼又亂了。那個(gè)時(shí)候迫于項(xiàng)目進(jìn)度大多都是知其然不知其所以然。后來有時(shí)間就把整個(gè)體系搞了個(gè)遍，終于摸通了來龍去脈。

在C++的CGI開發(fā)時(shí)大家喜歡用latin，這個(gè)屬于字節(jié)方式的編碼格式，存儲(chǔ)mysql節(jié)約空間，而C++也是比較容易控制到byte級(jí)別的語言。所以經(jīng)過框架封裝基本也問題不大。

在Java語言中，要涉及修改編碼問題的地方還真多。一個(gè)地方?jīng)]有設(shè)好就會(huì)亂碼滿天飛。大概總結(jié)包括以下這幾部分：瀏覽器、服務(wù)器、數(shù)據(jù)庫、操作系統(tǒng)。

瀏覽器：

如果使用模板語言，html需要設(shè)置顯示的字符集。這個(gè)適用于瀏覽器判斷什么編碼顯示。

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

擴(kuò)展，瀏覽器識(shí)別編碼的順序：
1.如果HTTP頭部申明了charset，則會(huì)使用HTTP頭部的，
2.讓HTTP頭部沒有設(shè)置，則會(huì)去解析meta標(biāo)簽的，
3.如果meta也沒有的話，瀏覽器會(huì)根據(jù)是否設(shè)置了auto detect來進(jìn)行編碼識(shí)別，
4.否則會(huì)使用本地UI的字符編碼。

服務(wù)器：
對(duì)于JSP等動(dòng)態(tài)語言，需要在jsp頭部設(shè)置編碼格式，J2EE服務(wù)器解析這個(gè)JSP的時(shí)候才會(huì)把整個(gè)頁面編碼為UTF-8輸出，不然就按照系統(tǒng)默認(rèn)編碼格式ISO-8859-1輸出了。JSP設(shè)置格式如下：

<%@ page language= "java" contentType = "text/html; charset=UTF-8" 
      pageEncoding ="UTF-8" %>

大家都知道，JSP對(duì)應(yīng)的就是servlet。servlet的編碼對(duì)應(yīng)如下設(shè)置：

public void service(HttpServletRequest request, HttpServletResponse response) 
throws ServletException,IOException{ 
response.setContentType("text/html;charset=utf-8"); 
}

還有不要漏掉大家常用的spring工具類，編碼轉(zhuǎn)換filter，很實(shí)用。在你用struts、spring mvc時(shí)這個(gè)過濾器幫你轉(zhuǎn)換沒有設(shè)置的編碼過濾。如下設(shè)置：

<filter> 
            <filter-name> Set Character Encoding</filter-name> 
            <filter-class> 
                 org.springframework.web.filter.CharacterEncodingFilter 
            </filter-class> 
            <init-param> 
                  <param-name> encoding</param-name> 
                  <param-value> UTF-8</param-value> 
            </init-param> 
      </filter>

萬一還有亂碼怎么辦呢？doGet方式的參數(shù)傳遞肯定會(huì)有亂碼問題。只需要在tomcat的監(jiān)聽器里設(shè)置編碼字符集如下（文件一般存儲(chǔ)在 /tomcat安裝目錄/conf/server.xml ）：

<Connector port="80" protocol="HTTP/1.1" 
              connectionTimeout="20000" 
              redirectPort="8443" URIEncoding="utf-8"   />

大家在開發(fā)的時(shí)候別忘了java文件本身也是有編碼格式的。在類文件右鍵查看屬性。

如果開發(fā)時(shí)忘記更改文件的編碼格式，windows默認(rèn)是GBK的，后來又要一直到utf8編碼的linux怎么辦。文件巨多，總不能一個(gè)一個(gè)去更改吧。其實(shí)很簡單，只需要在java命令的環(huán)境參數(shù)設(shè)置 -Dfile.encoding=GBK 解決。

編譯java代碼時(shí)，如果使用ant需要在javac里設(shè)置編譯的字符集。這樣打印的log輸出到文件或者控制臺(tái)上就不會(huì)亂碼了。

<javac debuglevel= "source,lines" source= "1.6"   encoding= "utf-8">

maven編譯時(shí)設(shè)置的字符集：

< artifactId> maven-compiler-plugin </artifactId > 
       < version> 2.5 </version > 
                        
         < configuration> 
           < optimize> true </optimize > 
           < showDeprecation> false </showDeprecation > 
           < debuglevel> lines,source </debuglevel > 
            < source> 1.6 </source > 
            < target> 1.6 </target > 
            < encoding> UTF-8 </encoding > 
            < meminitial> 128m </meminitial >   
             < maxmem> 768m </maxmem > 
                        
         </ configuration>

sqlmap的sql xml，sping的xml 也是需要設(shè)置的，因?yàn)樯婕暗娇缙脚_(tái)。頂上添加：

<!--?xml version="1.0" encoding="UTF-8"?-->

數(shù)據(jù)庫：
這里列出大家用的最多的Mysql字符集設(shè)置。打開mysql的配置文件( linux 一般在 /etc/my.cnf ，windows在mysql的安裝目錄 my.ini)。設(shè)置如下：

[mysqld] 
default-character-set = utf8 
 
[ mysql] 
character_set_server = utf8

jdbc需要設(shè)置

jdbc : mysql://192.168.0.237:3306/dzh_db?useUnicode=true&characterEncoding=UTF-8

這些都設(shè)置了一般的中文是不會(huì)有問題的。

不過最近出現(xiàn)了一個(gè)問題很搞怪。以前以為所有的字符只要設(shè)置好了所有數(shù)據(jù)都可以錄入數(shù)據(jù)庫，結(jié)果有些字符就不行，比如●■★這類型的。后來把這些字符變成字節(jié)碼，居然不是三位utf8的，我擦，大汗淋漓。后來查詢可以通過過濾utf8 特殊字符的方式處理。

#p#

public static String Utf2String (byte buf[]) { 
int len = buf.length ; 
StringBuffer sb = new StringBuffer(len / 2); 
for (int i = 0; i &lt; len; i++) { 
 
if (by2int(buf[i]) &lt;= 0x7F) 
sb.append(( char ) buf[i]); 
else if (by2int(buf[i]) &lt;= 0xDF &amp;&amp; by2int(buf[i]) &gt;= 0xC0) { 
int bh = by2int(buf[i] &amp; 0x1F); 
int bl = by2int(buf[++i] &amp; 0x3F); 
 
bl = by2int(bh &lt;&lt; 6 | bl); bh = by2int(bh &gt;&gt; 2); 
int c = bh &lt;&lt; 8 | bl; 
sb.append(( char ) c); 
} else if (by2int(buf[i]) &lt;= 0xEF &amp;&amp; by2int(buf[i]) &gt;= 0xE0) { 
int bh = by2int(buf[i] &amp; 0x0F); 
int bl = by2int(buf[++i] &amp; 0x3F); 
int bll = by2int(buf[++i] &amp; 0x3F); 
 
bh = by2int(bh &lt;&lt; 4 | bl &gt;&gt; 2); 
bl = by2int(bl &lt;&lt; 6 | bll); 
 
int c = bh &lt;&lt; 8 | bl; 
// 空格轉(zhuǎn)換為半角 
if (c == 58865) { 
c = 32; 
} 
sb.append(( char ) c); 
 
} 
} 
return sb.toString(); 
}

或者把mysql的字符集改為 utf8mb4 ，記得這個(gè)只有mysql55支持哦！

[mysqld] 
default-character-set =utf8mb4 
 
[ mysql] 
character_set_server = utf8mb4

操作系統(tǒng)：

windows默認(rèn)是gbk，一般不需要變動(dòng)。不過大家又想每個(gè)文件都要建立為utf8格式怎么辦，不可能我們每個(gè)文件建立后都去用屬性改變一下？太麻煩！直接在eclipse設(shè)置后，同種類型的文件建立都會(huì)是utf8格式。

linux，可以有兩個(gè)地方修改基本就足夠了：

vi /etc/sysconfig/i18n

修改

LANG="zh_CN.GB3212" 
LANGUAGE="zh_CN.GB18030:zh_CN.GB2312:zh_CN" 
SUPPORTED="zh_CN.GB18030:zh_CN:zh:en_US.UTF-8:en_US:en"

vi /etc/profile

export LC_ALL="zh_CN.GB2312" 
export LANG="zh_CN.GB2312"

原文鏈接：http://www.lanceyan.com/tech/arch/web_luanma.html

責(zé)任編輯：陳四芳來源： lanceyan.com

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<s id="e4cdr"></s>

<sub id="e4cdr"></sub>

<var id="e4cdr"></var>