自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一文搞懂Java正則表達(dá)式

開(kāi)發(fā) 前端
詳解如何在Java中構(gòu)建正則表達(dá)式,并提供一些示例正則表達(dá)式。

1 介紹

如果我們想根據(jù)特定的模式表示一組字符串,那么我們應(yīng)該使用正則表達(dá)式。

例如,我們可以編寫(xiě)一個(gè)正則表達(dá)式來(lái)表示所有有效的電子郵件地址,或者我們可以編寫(xiě)一個(gè)正則表達(dá)式來(lái)驗(yàn)證有效的電話(huà)號(hào)碼等。

使用正則表達(dá)式的最重要的應(yīng)用領(lǐng)域是:

  • 開(kāi)發(fā)驗(yàn)證框架,如Hibernate Validator。
  • 開(kāi)發(fā)模式匹配工具或應(yīng)用程序,如Linux中的Ctrl+F或grap cmd。
  • 開(kāi)發(fā)數(shù)字電路
  • 開(kāi)發(fā)翻譯器,如匯編器、編譯器和解釋器等。
  • 開(kāi)發(fā)通信協(xié)議TCP/IP、UDP等。

要在Java中使用正則表達(dá)式,我們可以利用java.util.regex包,該包包括以下類(lèi):

  • Pattern——這個(gè)類(lèi)是一組可以用于定義各種類(lèi)型模式的正則表達(dá)式的編譯(定義在搜索中使用的模式)。
  • Matcher——這個(gè)對(duì)象用于在Java中執(zhí)行匹配操作,用于在輸入字符串中搜索模式。
  • PatternSyntaxException——這個(gè)類(lèi)用于指示正則表達(dá)式模式中的語(yǔ)法錯(cuò)誤。

這里是一個(gè)正則表達(dá)式的示例代碼片段:

import java.util.regex.*;

public class RegularExpression {

    public static void main(String[] args) {
        int count = 0;
        Pattern pattern = Pattern.compile("ab");
        Matcher matcher = pattern.matcher("abcbcbcababacb");
        while (matcher.find()) {
            ++count;
            System.out.println(matcher.group()+ "...... found at: "+matcher.start());
        }

        System.out.println("The Total number of occurrence is " + count);

    }
}

/****
  Output-
  ab...... found at: 0
  ab...... found at: 7
  ab...... found at: 9
  The Total number of occurrence is 3
****/

2 Pattern

Pattern是一個(gè)已編譯的正則表達(dá)式,即Java中的模式等價(jià)物。我們可以使用Pattern類(lèi)的compile()方法創(chuàng)建一個(gè)模式對(duì)象。Pattern類(lèi)的compile()方法的簽名如下:

Flags——compile()方法中的標(biāo)志會(huì)改變搜索的方式。以下是其中幾個(gè):

  • CASE_INSENSITIVE——在執(zhí)行搜索時(shí)將忽略字母的大小寫(xiě)。
  • UNICODE_CASE——與CASE_INSENSITIVE標(biāo)志一起使用,它會(huì)忽略英語(yǔ)字母以外的字母的大小寫(xiě)。
  • LITERAL——使用時(shí),模式中的特殊字符將不具有任何特殊含義,在執(zhí)行搜索時(shí)只被視為普通字符。
public static Pattern compile(String regex)

以下是Pattern類(lèi)compile()方法的一個(gè)示例:

Pattern pattern = Pattern.compile("ab");

3 Matcher

matcher對(duì)象可用于檢查目標(biāo)字符串中的指定模式。使用Pattern類(lèi)的matcher()方法,我們可以生成一個(gè)匹配器對(duì)象。Pattern類(lèi)的matcher()方法具有以下簽名:

public Matcher matcher(CharSequence input)

以下是Pattern類(lèi)matcher()方法的示例:

Matcher matcher = pattern.matcher("abcbcbcababacb");

Matcher類(lèi)存在于java.util.regex包中。以下是Matcher類(lèi)一些最重要的方法:

  • boolean find()——這個(gè)方法嘗試查找下一個(gè)匹配項(xiàng),在找到匹配項(xiàng)時(shí)返回true,否則返回false。
  • int start()——這個(gè)方法返回匹配項(xiàng)在輸入字符串中的起始索引。
  • int end()——這個(gè)方法返回匹配項(xiàng)在輸入字符串中的結(jié)束索引。
  • String group()——這個(gè)方法返回匹配的模式。

注意:Pattern和Matcher類(lèi)存在于java.util.regex包中,從java1.4v開(kāi)始引入。

4 字符類(lèi)

  • [abc]——要么是'a'、'b'或'c'
  • [^abc]——除了'a'、'b'和'c'
  • [a-z]——任何從a到z的小寫(xiě)字母符號(hào)
  • [A-Z]——任何從A到Z的大寫(xiě)字母符號(hào)
  • [a-zA-Z]——任何字母符號(hào)
  • [0–9]——任何0到9的數(shù)字
  • [a-zA-Z0–9]——任何字母數(shù)字符號(hào)
  • [^a-zA-Z0–9]——除了字母數(shù)字符號(hào)(僅限特殊字符)

5 預(yù)定義字符類(lèi)

  • .——除換行符外的任何字符
  • \d——數(shù)字(0-9)
  • \D——非數(shù)字(0-9)
  • \w——單詞字符(a-z、A-Z、0-9、_)
  • \W——非單詞字符
  • \s——空格(空格、制表符、換行符)
  • \S——非空格(空格、制表符、換行符)
  • \b——單詞邊界
  • \B——非單詞邊界
  • \uxxxx——由十六進(jìn)制數(shù)xxxx指定的Unicode字符

6 量詞符

  • *——0次或多次
  • +——1次或多次
  • ?——0次或1次
  • {3}——精確數(shù)量3次
  • {3,4}——數(shù)字范圍(最小值,最大值)

我們可以使用量詞符指定要匹配的出現(xiàn)次數(shù)。

Pattern類(lèi)的split()方法

要根據(jù)特定的模式拆分目標(biāo)字符串,我們可以使用Pattern類(lèi)的split()方法。Pattern類(lèi)的split()方法具有以下簽名:

public String[] split(CharSequence input)

為了方便,我在這里包含了Pattern類(lèi)split()方法的代碼片段:

public class RegularExpression {

    public static void main(String[] args) {
        Pattern pattern = Pattern.compile("\\s");
        String[] splitString = pattern.split("Pattern class is present in java.util.regex");
        for (String text : splitString) {
            System.out.println(text);
        }

    }
}

/***
  Output -
    Pattern
    class
    is
    present
    in
    java.util.regex
***/

在上面的示例中,根據(jù)空格(\s)分割了字符串。

String類(lèi)的split()方法

String類(lèi)也包含split()方法。字符串類(lèi)的split()方法用于根據(jù)特定模式拆分目標(biāo)字符串。

public class RegularExpression {

    public static void main(String[] args) {
        String text = "This is example of String class split() method";
        String[] strings = text.split("\\s");
        for (String s : strings) {
            System.out.println(s);
        }
    }
}

/***
Output
  This
  is
  example
  of
  String
  class
  split()
  method
***/

在上面的例子中,字符串是根據(jù)空白(\s)來(lái)劃分的。

注意:Pattern類(lèi)的split()方法可以接受一個(gè)目標(biāo)字符串作為參數(shù),而String類(lèi)的split()方法可以接受一個(gè)正則表達(dá)式作為參數(shù)。

7 StringTokenizer

StringTokenizer是專(zhuān)門(mén)用于標(biāo)記化任務(wù)的類(lèi)。Java.util包中有一個(gè)StringTokenizer類(lèi)。

public class StringTokenizerDemo {

    public static void main(String[] args) {
     
        StringTokenizer tokenizer = new StringTokenizer("StringTokenizer class present in java.util package");
        while (tokenizer.hasMoreTokens()) {
            System.out.println(tokenizer.nextToken());

        }
    }
}

/***
  Output -
    StringTokenizer
    class
    present
    in
    java.util
    package
***/

注意:StringTokenizer的默認(rèn)正則表達(dá)式為空格符(\s)。

我們也可以根據(jù)需要傳遞正則表達(dá)式,以下是代碼片段有助于你更好地理解:

StringTokenizer tokenizer = new StringTokenizer("05-21-2023","-");
while (tokenizer.hasMoreTokens()) {
    System.out.println(tokenizer.nextToken());
}
/***
  Output
    05
    21
    2023
***/

我列了一些常用的編程正則表達(dá)式:

圖片

責(zé)任編輯:武曉燕 來(lái)源: Java學(xué)研大本營(yíng)
相關(guān)推薦

2024-08-07 10:54:59

正則表達(dá)式Java RegexJava

2020-09-18 06:42:14

正則表達(dá)式程序

2009-02-18 09:48:20

正則表達(dá)式Java教程

2016-11-10 16:21:22

Java 正則表達(dá)式

2018-09-27 15:25:08

正則表達(dá)式前端

2020-09-04 09:16:04

Python正則表達(dá)式虛擬機(jī)

2024-09-14 09:18:14

Python正則表達(dá)式

2011-07-11 12:33:30

JAVA

2009-06-08 16:49:05

Java正則表達(dá)式group

2023-10-07 08:25:09

Java處理工具正則表達(dá)式

2010-03-25 18:25:36

Python正則表達(dá)式

2021-01-27 11:34:19

Python正則表達(dá)式字符串

2009-09-16 18:19:34

正則表達(dá)式組

2011-06-02 12:34:16

正則表達(dá)式

2017-05-12 10:47:45

Linux正則表達(dá)式程序基礎(chǔ)

2019-07-17 15:45:47

正則表達(dá)式字符串前端

2022-03-28 06:19:14

正則表達(dá)式開(kāi)發(fā)

2021-07-14 23:54:01

正則表達(dá)式數(shù)據(jù)

2022-01-04 11:35:03

Linux Shel正則表達(dá)式Linux

2023-09-13 08:12:45

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)