自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

使用Java截取字符串的方法

作者：nokiaguy 2009-06-30 14:16:37

開發(fā) 后端

本文講述如何用Java實現(xiàn)按字節(jié)長度截取字符串。如果要截取的字符串是中、英文、數(shù)字混合的，往往產(chǎn)生問題。解決這個問題的方法是首先得到該字符串的UCS2編碼的字節(jié)數(shù)組。

Web應(yīng)用程序在瀏覽器中顯示字符串時，由于顯示長度的限制，常常需要將字符串截取后再進行顯示。但目前很多流行的語言，如C#、Java內(nèi)部采用的都是 Unicode 16（UCS2）編碼，在這種編碼中所有的字符都是兩個字符，因此，如果要截取的字符串是中、英文、數(shù)字混合的，就會產(chǎn)生問題，如下面的字符串：

String s = "a加b等于c，如果a等1、b等于2，那么c等3";

上面的字符串既有漢字，又有英文字符和數(shù)字。如果要截取前6個字節(jié)的字符，應(yīng)該是”a加b等"，但如果用substring方法截取前6個字符就成了"a 加b等于c"。產(chǎn)生這個問題的原因是將substring方法將雙字節(jié)的漢字當成一個字節(jié)的字符（UCS2字符）處理了。要解決這個問題的方法是首先得到該字符串的UCS2編碼的字節(jié)數(shù)組，如下面的代碼如下：

byte[] bytes = s.getBytes("Unicode");

由于上面生成的字節(jié)數(shù)組中前兩個字節(jié)是標志位，bytes[0] = -2，bytes[1] = -1，因此，要從第三個字節(jié)開始掃描，對于一個英文或數(shù)字字符，UCS2編碼的第二個字節(jié)是相應(yīng)的ASCII，第一個字節(jié)是0，如a的UCS2編碼是0 97，而漢字兩個字節(jié)都不為0，因此，可以利于UCS2編碼的這個規(guī)則來計算實際的字節(jié)數(shù)，該方法的實現(xiàn)代碼如下：

public static String bSubstring(String s, int length) throws Exception  
{  
 
    byte[] bytes = s.getBytes("Unicode");  
    int n = 0; // 表示當前的字節(jié)數(shù)  
    int i = 2; // 要截取的字節(jié)數(shù)，從第3個字節(jié)開始  
    for (; i < bytes.length && n < length; i++)  
    {  
        // 奇數(shù)位置，如3、5、7等，為UCS2編碼中兩個字節(jié)的第二個字節(jié)  
        if (i % 2 == 1)  
        {  
            n++; // 在UCS2第二個字節(jié)時n加1  
        }  
        else 
        {  
            // 當UCS2編碼的第一個字節(jié)不等于0時，該UCS2字符為漢字，一個漢字算兩個字節(jié)  
            if (bytes[i] != 0)  
            {  
                n++;  
            }  
        }  
    }  
    // 如果i為奇數(shù)時，處理成偶數(shù)  
    if (i % 2 == 1)  
 
    {  
        // 該UCS2字符是漢字時，去掉這個截一半的漢字  
        if (bytes[i - 1] != 0)  
            i = i - 1;  
        // 該UCS2字符是字母或數(shù)字，則保留該字符  
        else 
            i = i + 1;  
    }  
 
    return new String(bytes, 0, i, "Unicode");  
}

下面代碼使用了bSubstring方法：

String s = "a加b等于c，如果a等1、b等于2，那么c等3";  
System.out.println(bSubstring(s, 6));

上面的代碼截取的字符串是"a加b等"。

【編輯推薦】

實現(xiàn)Java中對象比較的兩個方法
初學(xué)Java多線程：使用Synchronized塊同步方法
初學(xué)Java多線程：使用Synchronized關(guān)鍵字同步類方法
初學(xué)Java多線程：從線程返回數(shù)據(jù)的兩種方法
初學(xué)Java多線程：向線程傳遞數(shù)據(jù)的三種方法

責任編輯：yangsai 來源：真的有外星人嗎

截取字符串

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="vwgqx"></style>

<cite id="vwgqx"><track id="vwgqx"></track></cite>