如何在 Java 中優(yōu)雅地分割 String 字符串
分割字符串是 Java 編程中常用的操作,相信很多同學(xué)都知道,String 類中的 split 方法可以進(jìn)行字符串分割,然而日常使用起來卻僅限于 str.split( "-"),其中 "-"為分隔符。其實 split 方法的功能非常強大,可以更優(yōu)雅地使用它分割字符串。
使用方法
split 方法的一種聲明為,
- public String[] split(String regex)
其中 regex 指的是正則表達(dá)式分隔符,我們平時使用單個字符作為分隔符,其實可以看作特殊的正則表達(dá)式,特殊之處在于這種表達(dá)式只匹配它自身,如 "-" 只匹配 "-", 示例如下:
- String string = "86-15003455666";
- String[] parts = string.split("-");
- String part1 = parts[0]; // 86
- String part2 = parts[1]; // 15003455666
split 方法的另一個聲明為:
- public String[] split(String regex, int limit)
regex 指的是 正則表達(dá)式分隔符,limit 指定的則是分割的份數(shù),舉個例子就明白了
- String string = "004-556-42";
- String[] parts = string.split("-", 2); // 限定分割兩份
- String part1 = parts[0]; // 004
- String part2 = parts[1]; // 556-42
而在某些場景下,我們可能想要在結(jié)果中保留分隔符,這也是可以做到了設(shè)置分隔符與分割后左側(cè)的結(jié)果相連,
- String string = "86-15003455666";
- String[] parts = string.split("(?<=-)");
- String part1 = parts[0]; // 86-
- String part2 = parts[1]; // 15003455666
設(shè)置分隔符與分割后右側(cè)的結(jié)果相連,
- String string = "86-15003455666";
- String[] parts = string.split("(?=-)");
- String part1 = parts[0]; // 86
- String part2 = parts[1]; // -15003455666
機智的你可能已經(jīng)發(fā)現(xiàn)了,其實分割方法的精妙之處,全在于正則表達(dá)式 regex 的設(shè)置,正則表達(dá)式還是要好好學(xué)習(xí)的!
妙用正則表達(dá)式
在實際的工作場景中,對于要分割的字符串,我們在分割之前,往往需要校驗下它的格式,只有符合我們的要求,我們才對它進(jìn)行拆分處理。而使用 Pattern 類加 Matcher 類,可以使字符串的格式識別和分割操作一氣呵成:
- public class SplitExample {
- //\d代表數(shù)字,+代表出現(xiàn)一次或多次。所以(\\d+)-(\\d+)匹配用"-"相連的兩個數(shù)字串
- // Pattern 對象是正則表達(dá)式的編譯表示
- private static Pattern twopart = Pattern.compile("(\\d+)-(\\d+)");
- public static void checkString(String s)
- {
- // Matcher對象對輸入字符串進(jìn)行解釋和匹配操作
- Matcher m = twopart.matcher(s);
- if (m.matches()) {
- //m.group(1) 和 m.group(2) 存儲分割后的子串
- System.out.println(s + " matches; first part is " + m.group(1) +
- ", second part is " + m.group(2) + ".");
- } else {
- System.out.println(s + " does not match.");
- }
- }
- public static void main(String[] args) {
- checkString("123-4567"); // 匹配
- checkString("s-tar"); // 字母序列,不匹配
- checkString("123-"); // "-"右側(cè)的數(shù)字串為空,不匹配
- checkString("-4567"); // "-"左側(cè)的數(shù)字串為空,不匹配
- checkString("123-4567-890"); // 存在兩個"-",不匹配
- }
- }
上述程序的運行結(jié)果為: