Java 截取字符串的幾種操作
大家好,我是指北君。
在本文中,我們將學(xué)習(xí)在Java中把一個String截斷到所需的字符數(shù)的集中方法。
首先,我們將探索使用JDK本身來實現(xiàn)這一目標(biāo)的方法。然后,我們將研究如何使用一些流行的第三方庫來實現(xiàn)這一目標(biāo)。
使用JDK截斷一個字符串
Java提供了許多方便的方法來截斷一個 String 。讓我們來看看。
使用 String 的 substring() 方法
String 類有一個方便的方法,叫做 substring? ,正如其名稱所示 , substring()? 返回指定索引之間的 String 部分。
讓我們來看看它的運行情況。
static String usingSubstringMethod(String text, int length) {
if (text.length() <= length) {
return text;
} else {
return text.substring(0, length);
}
}
在上面的例子中,如果指定的 length 大于 text 的長度,我們返回 text 本身。這是因為 傳遞給 substring()? 的 length 大于 String 的字符數(shù)會導(dǎo)致 IndexOutOfBoundsException 。
否則,我們將返回從索引0開始并延伸到--但不包括--索引 length 的字符的子串。
讓我們用一個測試案例來確認這一點。
static final String TEXT = "Welcome to javanorth.cn";
@Test
public void givenStringAndLength_whenUsingSubstringMethod_thenTrim() {
assertEquals(TrimStringOnLength.usingSubstringMethod(TEXT, 10), "Welcome to");
}
正如我們所看到的, 的起始索引是包容的,結(jié)束索引是排他的 。因此, 索引 length 處的字符將不包括在返回的子串中。
使用 String 的 split() 方法
另一種截斷 String 的方法是使用 split() 方法,它使用正則表達式將 String 分割成若干部分。
這里我們將使用一個叫做 positive lookbehind 的正則表達式特征來匹配從 String 開始的指定數(shù)量的字符。
static String usingSplitMethod(String text, int length) {
String[] results = text.split("(?<=\\G.{" + length + "})");
return results[0];
}
results 的第一個元素將是我們截斷的 String ,如果 length 長于 text ,則是原始的 String 。
讓我們測試一下我們的方法。
@Test
public void givenStringAndLength_whenUsingSplitMethod_thenTrim() {
assertEquals(TrimStringOnLength.usingSplitMethod(TEXT, 13), "Welcome to ba");
}
使用 Pattern 類
同樣, 我們可以使用 Pattern 類來編譯一個正則表達式,該表達式可以匹配 String 的開頭,直至指定的字符數(shù) 。
例如,讓我們使用 {1," + length + "}. 這個正則表達式至少匹配一個,最多匹配 length 個字符。
static String usingPattern(String text, int length) {
Optional<String> result = Pattern.compile(".{1," + length + "}")
.matcher(text)
.results()
.map(MatchResult::group)
.findFirst();
return result.isPresent() ? result.get() : EMPTY;
}
正如我們在上面看到的,在將我們的正則表達式編譯成 Pattern 后,我們可以使用 Pattern的 matcher() 方法來根據(jù)該正則表達式解釋我們的 String 。然后我們就可以將結(jié)果分組,并返回第一個結(jié)果,也就是我們截斷的 String 。
現(xiàn)在讓我們添加一個測試案例來驗證我們的代碼是否如預(yù)期那樣工作。
@Test
public void givenStringAndLength_whenUsingPattern_thenTrim() {
assertEquals(TrimStringOnLength.usingPattern(TEXT, 19), "Welcome to javanorth");
}
使用 CharSequence 的 codePoints() 方法
Java 9提供了一個 codePoints() 方法來將一個 String 轉(zhuǎn)換為一個碼點值流。
讓我們看看如何使用這個方法與 Stream API相結(jié)合來截斷一個字符串。
static String usingCodePointsMethod(String text, int length) {
return text.codePoints()
.limit(length)
.collect(StringBuilder::new, StringBuilder::appendCodePoint, StringBuilder::append)
.toString();
}
在這里,我們使用 limit() 方法來限制 Stream 的長度 。然后我們使用 StringBuilder 來建立我們的截斷字符串。
接下來,讓我們驗證一下我們的方法是否有效。
@Test
public void givenStringAndLength_whenUsingCodePointsMethod_thenTrim() {
assertEquals(TrimStringOnLength.usingCodePointsMethod(TEXT, 6), "Welcom");
}
Apache Commons 庫
Apache Commons Lang 庫包括一個 StringUtils 類,用于操作 String。
首先,讓我們把Apache Commons dependency添加到我們的 pom.xml 。
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-lang3</artifactId>
<version>3.12.0</version>
</dependency>
使用 StringUtils的left() 方法
StringUtils 有一個有用的 靜態(tài) 方法叫 left() 。 StringUtils.left() 以一種安全的方式返回 String 最左邊的指定字符數(shù): 。
static String usingLeftMethod(String text, int length) {
return StringUtils.left(text, length);
}
使用 StringUtils 的 truncate() 方法
另外,我們可以使用 StringUtils.truncate() 來達到同樣的目的。
public static String usingTruncateMethod(String text, int length) {
return StringUtils.truncate(text, length);
}
Guava庫
除了使用核心Java方法和Apache Commons庫來截斷一個 String 之外,我們還可以使用 Guava。讓我們首先把Guava的 dependency 添加到我們的 pom.xml 文件中。
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>31.0.1-jre</version>
</dependency>
現(xiàn)在我們可以使用Guava的 Splitter 類來截斷我們的 String 。
static String usingSplitter(String text, int length) {
Iterable<String> parts = Splitter.fixedLength(length)
.split(text);
return parts.iterator()
.next();
}
我們使用 Splitter.fixedLength() 將我們的 String 分割成多個給定長度的片段。然后,我們返回結(jié)果中的第一個元素。
總結(jié)
在這篇文章中,我們學(xué)習(xí)了在Java中把一個 String 截斷為特定數(shù)量的字符的各種方法。我們看了一些使用JDK來做這件事的方法。然后,我們使用一些第三方庫來截斷 String 。