自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Java編碼及網(wǎng)絡(luò)傳輸中的編碼問(wèn)題

開(kāi)發(fā) 后端
本文主要講作者對(duì)FTP搜索中遇到編碼的問(wèn)題進(jìn)行了研究,主要分為三部分:表單數(shù)據(jù)的編碼、網(wǎng)址的編碼、亂碼恢復(fù)。詳細(xì)請(qǐng)看下文。

近來(lái)試著FTP搜索,遇到編碼問(wèn)題,研究了下。

Java內(nèi)部的String為Unicode編碼,每個(gè)字符占兩個(gè)字節(jié)。

Java編解碼方法如下:

  1. String str = "hi好啊me";  
  2. byte[] gbkBytes=str.getBytes("GBK");//將String的Unicode編碼轉(zhuǎn)為GBK編碼,輸出到字節(jié)中  
  3. String string=new String(gbkBytes,"GBK");//gbkBytes中的字節(jié)流以GBK方案解碼成Unicode形式的Java字符串 

1、表單數(shù)據(jù)的編碼

現(xiàn)在的問(wèn)題是,在網(wǎng)絡(luò)中,不知道客戶端發(fā)過(guò)來(lái)的字節(jié)流的編碼方案(發(fā)送前瀏覽器會(huì)對(duì)數(shù)據(jù)編碼?。?!各個(gè)瀏覽器還不一樣!?。。?/p>

解決方案如下:

當(dāng)然URLEncoder.encode(str, "utf-8")和URLDecoder.decode(strReceive,"utf-8")方法中的編碼方案要一致。

2、網(wǎng)址的編碼

但以上方法只適合表單數(shù)據(jù)的提交;對(duì)于URL則不行!??!原因是URLEncoder把'/'也編碼了,瀏覽器發(fā)送時(shí)報(bào)錯(cuò)?。?!那么,只要http://IP/子目錄把http://IP/這部分原封不動(dòng)(當(dāng)然這部分不要有中文),之后的數(shù)據(jù)以'/'分割后分段編碼即可。

代碼如下:

  1. /**  
  2.  * 對(duì){@link URLEncoder#encode(String, String)}的封裝,但不編碼'/'字符,對(duì)其他字符分段編碼  
  3.  *   
  4.  * @param str  
  5.  *            要編碼的URL  
  6.  * @param encoding  
  7.  *            編碼格式  
  8.  * @return 字符串以字符'/'隔開(kāi),對(duì)每一段單獨(dú)編碼以encoding編碼格式編碼  
  9.  * @version: 2012_01_10  
  10.  *           <p>  
  11.  *           注意:未考慮':',如直接對(duì)http://編解碼,會(huì)產(chǎn)生錯(cuò)誤?。?!請(qǐng)?jiān)谑褂们皩⑵浞蛛x出來(lái),可以使用  
  12.  *           {@link #encodeURLAfterHost(String, String)}方法解決此問(wèn)題  
  13.  *           <p>  
  14.  *           注意:對(duì)字符/一起編碼,導(dǎo)致URL請(qǐng)求異常??!  
  15.  */ 
  16. public static String encodeURL(String str, String encoding) {  
  17.     final char splitter = '/';  
  18.     try {  
  19.         StringBuilder sb = new StringBuilder(2 * str.length());  
  20.         int start = 0;  
  21.         for (int i = 0; i < str.length(); i++) {  
  22.             if (str.charAt(i) == splitter) {  
  23.                 sb.append(URLEncoder.encode(str.substring(start, i),  
  24.                         encoding));  
  25.                 sb.append(splitter);  
  26.                 start = i + 1;  
  27.             }  
  28.         }  
  29.         if (start < str.length())  
  30.             sb.append(URLEncoder.encode(str.substring(start), encoding));  
  31.         return sb.toString();  
  32.     } catch (UnsupportedEncodingException e) {  
  33.         e.printStackTrace();  
  34.     }  
  35.     return null;  
  36. }  
  37.  
  38. /**  
  39.  * 對(duì)IP地址后的URL通過(guò)'/'分割后進(jìn)行分段編碼.  
  40.  * <p>  
  41.  * 對(duì){@link URLEncoder#encode(String, String)}  
  42.  * 的封裝,但不編碼'/'字符,也不編碼網(wǎng)站部分(如ftp://a.b.c.d/部分,檢測(cè)方法為對(duì)三個(gè)'/'字符的檢測(cè),且要求前兩個(gè)連續(xù)),  
  43.  * 對(duì)其他字符分段編碼  
  44.  *   
  45.  * @param str  
  46.  *            要編碼的URL  
  47.  * @param encoding  
  48.  *            編碼格式  
  49.  * @return IP地址后字符串以字符'/'隔開(kāi),對(duì)每一段單獨(dú)編碼以encoding編碼格式編碼,其他部分不變  
  50.  * @version: 2012_01_10  
  51.  *           <p>  
  52.  *           注意:對(duì)字符/一起編碼,導(dǎo)致URL請(qǐng)求異常!!  
  53.  */ 
  54. public static String encodeURLAfterHost(String str, String encoding) {  
  55.     final char splitter = '/';  
  56.  
  57.     int index = str.indexOf(splitter);//***個(gè)'/'的位置  
  58.     index++;//移到下一位置!!  
  59.     if (index < str.length() && str.charAt(index) == splitter) {//檢測(cè)***個(gè)'/'之后是否還是'/',如ftp://  
  60.         index++;//從下一個(gè)開(kāi)始  
  61.         index = str.indexOf(splitter, index);//第三個(gè)'/';如ftp://anonymous:tmp@g.cn:219.223.168.20/中的***一個(gè)'/'  
  62.         if (index > 0) {  
  63.             return str.substring(0, index + 1)  
  64.                     + encodeURL(str.substring(index + 1), encoding);//如ftp://anonymous:tmp@g.cn:219.223.168.20/天空  
  65.         } else 
  66.             return str;//如ftp://anonymous:tmp@g.cn:219.223.168.20  
  67.     }  
  68.  
  69.     return encodeURL(str, encoding);  
  70.  
  71. }  
  72.  
  73. /**  
  74.  * 對(duì)IP地址后的URL通過(guò)'/'分割后進(jìn)行分段編碼.  
  75.  * 此方法與{@link #decodeURLAfterHost(String, String)}配對(duì)使用  
  76.  * @param str  
  77.  *            要解碼的URL  
  78.  * @param encoding  
  79.  *            str的編碼格式  
  80.  * @return IP地址后字符串以字符'/'隔開(kāi),對(duì)每一段單獨(dú)解碼以encoding編碼格式解碼,其他部分不變  
  81.  * @version: 2012_01_10  
  82.  *   
  83.  *           <p>  
  84.  *           注意:對(duì)字符/一起解碼,將導(dǎo)致URL請(qǐng)求異常??!  
  85.  */ 
  86. public static String decodeURLAfterHost(String str, String encoding) {  
  87.     final char splitter = '/';  
  88.     int index = str.indexOf(splitter);//***個(gè)'/'的位置  
  89.     index++;//移到下一位置??!  
  90.     if (index < str.length() && str.charAt(index) == splitter) {//檢測(cè)***個(gè)'/'之后是否還是'/',如ftp://  
  91.         index++;//從下一個(gè)開(kāi)始  
  92.         index = str.indexOf(splitter, index);//第三個(gè)'/';如ftp://anonymous:tmp@g.cn:219.223.168.20/中的***一個(gè)'/'  
  93.         if (index > 0) {  
  94.             return str.substring(0, index + 1)  
  95.                     + decodeURL(str.substring(index + 1), encoding);//如ftp://anonymous:tmp@g.cn:219.223.168.20/天空  
  96.         } else 
  97.             return str;//如ftp://anonymous:tmp@g.cn:219.223.168.20  
  98.     }  
  99.  
  100.     return decodeURL(str, encoding);  
  101.  
  102. }  
  103.  
  104. /**  
  105.  * 此方法與{@link #encodeURL(String, String)}配對(duì)使用  
  106.  * <p>  
  107.  * 對(duì){@link URLDecoder#decode(String, String)}的封裝,但不解碼'/'字符,對(duì)其他字符分段解碼  
  108.  *   
  109.  * @param str  
  110.  *            要解碼的URL  
  111.  * @param encoding  
  112.  *            str的編碼格式  
  113.  * @return 字符串以字符'/'隔開(kāi),對(duì)每一段單獨(dú)編碼以encoding編碼格式解碼  
  114.  * @version: 2012_01_10  
  115.  *   
  116.  *           <p>  
  117.  *           注意:對(duì)字符/一起編碼,導(dǎo)致URL請(qǐng)求異常??!  
  118.  */ 
  119. public static String decodeURL(String str, String encoding) {  
  120.     final char splitter = '/';  
  121.     try {  
  122.         StringBuilder sb = new StringBuilder(str.length());  
  123.         int start = 0;  
  124.         for (int i = 0; i < str.length(); i++) {  
  125.             if (str.charAt(i) == splitter) {  
  126.                 sb.append(URLDecoder.decode(str.substring(start, i),  
  127.                         encoding));  
  128.                 sb.append(splitter);  
  129.                 start = i + 1;  
  130.             }  
  131.         }  
  132.         if (start < str.length())  
  133.             sb.append(URLDecoder.decode(str.substring(start), encoding));  
  134.         return sb.toString();  
  135.     } catch (UnsupportedEncodingException e) {  
  136.         e.printStackTrace();  
  137.     }  
  138.     return null;  

3、亂碼了還能恢復(fù)?

問(wèn)題如下:

貌似圖中的utf-8改成iso8859-1是可以的,utf-8在字符串中有中文時(shí)不行(但英文部分仍可正確解析)!??!畢竟GBK的字節(jié)流對(duì)于utf-8可能是無(wú)效的,碰到無(wú)效的字符怎么解析,是否可逆那可不好說(shuō)啊。

測(cè)試代碼如下:

  1. package tests;  
  2.  
  3. import java.io.UnsupportedEncodingException;  
  4. import java.net.URLEncoder;  
  5.  
  6. /**  
  7.  * @author LC  
  8.  * @version: 2012_01_12  
  9.  */ 
  10. public class TestEncoding {  
  11.     static String utf8 = "utf-8";  
  12.     static String iso = "iso-8859-1";  
  13.     static String gbk = "GBK";  
  14.  
  15.     public static void main(String[] args) throws UnsupportedEncodingException {  
  16.         String str = "hi好啊me";  
  17.         //      System.out.println("?的十六進(jìn)制為:3F");  
  18.         //      System.err  
  19.         //              .println("出現(xiàn)中文時(shí),如果編碼方案不支持中文,每個(gè)字符都會(huì)被替換為?的對(duì)應(yīng)編碼!(如在iso-8859-1中)");  
  20.         System.out.println("原始字符串:\t\t\t\t\t\t" + str);  
  21.         String utf8_encoded = URLEncoder.encode(str, "utf-8");  
  22.         System.out.println("用URLEncoder.encode()方法,并用UTF-8編碼后:\t\t" + utf8_encoded);  
  23.         String gbk_encoded = URLEncoder.encode(str, "GBK");  
  24.         System.out.println("用URLEncoder.encode()方法,并用GBK編碼后:\t\t" + gbk_encoded);  
  25.         testEncoding(str, utf8, gbk);  
  26.         testEncoding(str, gbk, utf8);  
  27.         testEncoding(str, gbk, iso);  
  28.         printBytesInDifferentEncoding(str);  
  29.         printBytesInDifferentEncoding(utf8_encoded);  
  30.         printBytesInDifferentEncoding(gbk_encoded);  
  31.     }  
  32.  
  33.     /**  
  34.      * 測(cè)試用錯(cuò)誤的編碼方案解碼后再編碼,是否對(duì)原始數(shù)據(jù)有影響  
  35.      *   
  36.      * @param str  
  37.      *            輸入字符串,Java的String類型即可  
  38.      * @param encodingTrue  
  39.      *            編碼方案1,用于模擬原始數(shù)據(jù)的編碼  
  40.      * @param encondingMidian  
  41.      *            編碼方案2,用于模擬中間的編碼方案  
  42.      * @throws UnsupportedEncodingException  
  43.      */ 
  44.     public static void testEncoding(String str, String encodingTrue,  
  45.             String encondingMidian) throws UnsupportedEncodingException {  
  46.         System.out.println();  
  47.         System.out  
  48.                 .printf("%s編碼的字節(jié)數(shù)據(jù)->用%s解碼并轉(zhuǎn)為Unicode編碼的JavaString->用%s解碼變?yōu)樽止?jié)流->讀入Java(用%s解碼)后變?yōu)镴ava的String\n",  
  49.                         encodingTrue, encondingMidian, encondingMidian,  
  50.                         encodingTrue);  
  51.         System.out.println("原始字符串:\t\t" + str);  
  52.         byte[] trueEncodingBytes = str.getBytes(encodingTrue);  
  53.         System.out.println("原始字節(jié)流:\t\t" + bytesToHexString(trueEncodingBytes)  
  54.                 + "\t\t//即用" + encodingTrue + "編碼后的字節(jié)流");  
  55.         String encodeUseMedianEncoding = new String(trueEncodingBytes,  
  56.                 encondingMidian);  
  57.         System.out.println("中間字符串:\t\t" + encodeUseMedianEncoding + "\t\t//即用" 
  58.                 + encondingMidian + "解碼原始字節(jié)流后的字符串");  
  59.         byte[] midianBytes = encodeUseMedianEncoding.getBytes("Unicode");  
  60.         System.out.println("中間字節(jié)流:\t\t" + bytesToHexString(midianBytes)  
  61.                 + "\t\t//即中間字符串對(duì)應(yīng)的Unicode字節(jié)流(和Java內(nèi)存數(shù)據(jù)一致)");  
  62.         byte[] redecodedBytes = encodeUseMedianEncoding  
  63.                 .getBytes(encondingMidian);  
  64.         System.out.println("解碼字節(jié)流:\t\t" + bytesToHexString(redecodedBytes)  
  65.                 + "\t\t//即用" + encodingTrue + "解碼中間字符串(流)后的字符串");  
  66.         String restored = new String(redecodedBytes, encodingTrue);  
  67.         System.out.println("解碼字符串:\t\t" + restored + "\t\t和原始數(shù)據(jù)相同?  " 
  68.                 + restored.endsWith(str));  
  69.     }  
  70.  
  71.     /**  
  72.      * 將字符串分別編碼為GBK、UTF-8、iso-8859-1的字節(jié)流并輸出  
  73.      *   
  74.      * @param str  
  75.      * @throws UnsupportedEncodingException  
  76.      */ 
  77.     public static void printBytesInDifferentEncoding(String str)  
  78.             throws UnsupportedEncodingException {  
  79.         System.out.println("");  
  80.         System.out.println("原始String:\t\t" + str + "\t\t長(zhǎng)度為:" + str.length());  
  81.         String unicodeBytes = bytesToHexString(str.getBytes("unicode"));  
  82.         System.out.println("Unicode bytes:\t\t" + unicodeBytes);  
  83.         String gbkBytes = bytesToHexString(str.getBytes("GBK"));  
  84.         System.out.println("GBK bytes:\t\t" + gbkBytes);  
  85.         String utf8Bytes = bytesToHexString(str.getBytes("utf-8"));  
  86.         System.out.println("UTF-8 bytes:\t\t" + utf8Bytes);  
  87.         String iso8859Bytes = bytesToHexString(str.getBytes("iso-8859-1"));  
  88.         System.out.println("iso8859-1 bytes:\t" + iso8859Bytes + "\t\t長(zhǎng)度為:" 
  89.                 + iso8859Bytes.length() / 3);  
  90.         System.out.println("可見(jiàn)Unicode在之前加了兩個(gè)字節(jié)FE FF,之后則每個(gè)字符兩字節(jié)");  
  91.     }  
  92.  
  93.     /**  
  94.      * 將該數(shù)組轉(zhuǎn)的每個(gè)byte轉(zhuǎn)為兩位的16進(jìn)制字符,中間用空格隔開(kāi)  
  95.      *   
  96.      * @param bytes  
  97.      *            要轉(zhuǎn)換的byte序列  
  98.      * @return 轉(zhuǎn)換后的字符串  
  99.      */ 
  100.     public static final String bytesToHexString(byte[] bytes) {  
  101.         StringBuilder sb = new StringBuilder(bytes.length * 2);  
  102.         for (int i = 0; i < bytes.length; i++) {  
  103.             String hex = Integer.toHexString(bytes[i] & 0xff);// &0xff是byte小于0時(shí)會(huì)高位補(bǔ)1,要改回0  
  104.             if (hex.length() == 1)  
  105.                 sb.append('0');  
  106.             sb.append(hex);  
  107.             sb.append(" ");  
  108.         }  
  109.         return sb.toString().toUpperCase();  
  110.     }  

原文鏈接:http://cherishlc.iteye.com/blog/1343502

【編輯推薦】

  1. 探討:Java中刪除數(shù)組中重復(fù)元素
  2. 用Java GUI編寫(xiě)的畫(huà)板程序
  3. Java的動(dòng)態(tài)綁定機(jī)制
  4. Java中帶復(fù)選框的樹(shù)的實(shí)現(xiàn)和應(yīng)用
  5. Java網(wǎng)絡(luò)編程菜鳥(niǎo)進(jìn)階:TCP和套接字入門(mén)
責(zé)任編輯:林師授 來(lái)源: cherishLC的博客
相關(guān)推薦

2009-05-05 09:46:18

Java編碼理論字符

2019-05-29 09:38:44

MySQL字符編碼數(shù)據(jù)庫(kù)

2009-06-30 14:22:50

Java編碼

2009-06-29 16:24:00

JSP和Servlet

2009-06-30 17:10:28

JSP和Servlet

2009-06-30 14:51:19

JSP和Servlet

2012-08-24 09:05:30

IBMdW

2010-03-23 14:34:44

Python vim檢

2010-05-11 17:45:17

MySQL字符

2014-04-14 10:03:16

2012-03-08 15:03:49

JavaScript

2009-12-24 10:12:02

Linux查看文件編碼

2018-07-04 14:56:02

HTTP傳輸編碼

2012-03-09 10:27:37

Java

2010-05-19 17:24:55

MySQL編碼

2010-03-05 15:02:09

Linux文件編碼

2011-02-24 09:27:00

Java字符集編碼

2021-01-01 09:05:50

java編碼亂碼

2009-11-27 16:16:58

Suse中文編碼

2010-05-20 17:40:54

MySQL編碼
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)