自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<var id="ksl79"><button id="ksl79"><span id="ksl79"></span></button></var>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

正則表達(dá)式不用背

作者：CUGGZ 2023-09-13 08:12:45

開發(fā) 前端

被括號包圍的子模式稱為“捕獲組”，捕獲組可以從匹配的字符串中提取出指定的部分并單獨(dú)使用。這里我們使用 $1 來引用第一個捕獲組 (Testing|tests)。也可以匹配多個組，比如同時匹配 (Testing|tests) 和 (123)。

正則表達(dá)式是一個強(qiáng)大的文本匹配工具。但是，對于初學(xué)者來說，眾多的符號和規(guī)則可能讓人難以理解。其實(shí)，你不需要記住所有的正則表達(dá)式語法！本文將分享一些簡單而實(shí)用的技巧，幫助理解正則表達(dá)式的核心概念，輕松使用正則表達(dá)式！

基礎(chǔ)入門

概念

正則表達(dá)式（Regular Expression，在代碼中常簡寫為regex、regexp或RE）使用單個字符串來描述、匹配一系列符合某個句法規(guī)則的字符串搜索模式。搜索模式可用于文本搜索和文本替換。它用一系列字符定義搜索模式。

正則表達(dá)式的用途有很多，比如：

表單輸入驗(yàn)證；
搜索和替換；
過濾大量文本文件（如日志）中的信息；
讀取配置文件；
網(wǎng)頁抓??；
處理具有一致語法的文本文件，例如 CSV。

創(chuàng)建

正則表達(dá)式的語法如下：

/正則表達(dá)式主體/修飾符(可選)

先來看一個最基本的正則表達(dá)式：/處/，它只匹配到了字符串中的第一個“處”：

這里，正則表達(dá)式的主體就是“處”，沒有使用修飾符，我們會在后面來介紹正則表達(dá)式的修飾符。

創(chuàng)建正則表達(dá)式的方式有兩種：

字面量：正則表達(dá)式直接放在/ /之中：

const rex = /pattern/;

構(gòu)造函數(shù)：RegExp 對象表示正則表達(dá)式的一個實(shí)例：

const rex = new RegExp("pattern");

這兩種方法的一大區(qū)別是對象的構(gòu)造函數(shù)允許傳遞帶引號的表達(dá)式，通過這種方式就可以動態(tài)創(chuàng)建正則表達(dá)式。

通過這兩種方法創(chuàng)建出來的 Regex 對象都具有相同的方法和屬性：

let RegExp1 = /a|b/

let RegExp2 = new RegExp('a|b')

console.log(RegExp1)  // 輸出結(jié)果：/a|b/
console.log(RegExp2)  // 輸出結(jié)果：/a|b/

RegExp 實(shí)例

實(shí)例方法

RegExp 實(shí)例置了test()和exec() 這兩個方法來校驗(yàn)正則表達(dá)式。下面來分別看一下這兩個方法。

（1）test()

test()用于檢測一個字符串是否匹配某個模式，如果字符串中含有匹配的文本，則返回 true，否則返回 false。

const regex1 = /a/ig;
const regex2 = /hello/ig;
const str = "Action speak louder than words";

console.log(regex1.test(str));  // true
console.log(regex2.test(str));  // false

（2）exec()

exec()用于檢索字符串中的正則表達(dá)式的匹配。該函數(shù)返回一個數(shù)組，其中存放匹配的結(jié)果。如果未找到匹配，則返回值為 null。

const regex1 = /a/ig;
const regex2 = /hello/ig;
const str = "Action speak louder than words";

console.log(regex1.exec(str));  // ['A', index: 0, input: 'Action speak louder than words', groups: undefined]
console.log(regex2.exec(str));  // null

在當(dāng)在全局正則表達(dá)式中使用 exec 時，每隔一次就會返回null，如圖：

這是怎么回事呢？MDN 的解釋如下：

在設(shè)置了 global 或 sticky 標(biāo)志位的情況下（如 /foo/g or /foo/y），JavaScript RegExp 對象是有狀態(tài)的。他們會將上次成功匹配后的位置記錄在 lastIndex 屬性中。使用此特性，exec() 可用來對單個字符串中的多次匹配結(jié)果進(jìn)行逐條的遍歷（包括捕獲到的匹配），而相比之下， String.prototype.match() 只會返回匹配到的結(jié)果。

為了解決這個問題，我們可以在運(yùn)行每個exec命令之前將lastIndex賦值為 0：

實(shí)例屬性

RegExp 實(shí)例還內(nèi)置了一些屬性，這些屬性可以獲知一個正則表達(dá)式的各方面的信息，但是用處不大。

屬性	描述
`global`	布爾值，表示是否設(shè)置了g標(biāo)志
`ignoreCase`	布爾值，表示是否設(shè)置了i標(biāo)志
`lastIndex`	整數(shù)，表示開始搜索下一個匹配項(xiàng)的字符位置，從0算起
`multiline`	布爾值，表示是否設(shè)置了m標(biāo)志
`source`	正則表達(dá)式的字符串表示，按照字面量形式而非傳入構(gòu)造函數(shù)重大的字符串模式匹配

模式匹配

關(guān)于正則表達(dá)式最復(fù)雜的地方就是如何編寫正則規(guī)則了，下面就來看如何編寫正則表達(dá)式。

修飾符

正則表達(dá)式的修飾符是一種可以在正則表達(dá)式模式中添加的標(biāo)記，用于修改搜索模式的行為。這些修飾符通常以單個字符形式出現(xiàn)在正則表達(dá)式的末尾，并且可以通過在正則表達(dá)式模式前添加該字符來啟用修飾符。

常見的修飾符如下：

g：表示全局模式，即運(yùn)用于所有字符串；
i：表示不區(qū)分大小寫，即匹配時忽略字符串的大小寫；
m：表示多行模式，強(qiáng)制 $ 和 ^ 分別匹配每個換行符。

最開始的例子中，字符串中有兩個“處”，但是只匹配到了一個。這是因?yàn)檎齽t表達(dá)式默認(rèn)匹配第一個符合條件的字符。如果想要匹配所有符合條件的字符，就可以使用 g 修飾符：

/處/g

這樣就匹配到了所有符合條件的字符：

圖片

當(dāng)需要匹配引英文字符串，并且忽略字符串的字母大小寫時，i 修飾符就派上用場了。先來看下面的表達(dá)式：

/a/g

在進(jìn)行匹配時，它匹配到了字符串中所有的 a 字符。但是最開始的 A 是沒匹配到的，因?yàn)閮烧叽笮懖灰恢拢?/p>

那我們來添加上 i 修飾符：

/a/gi

這時所有的 a 都被匹配到了，無論是大寫還是小寫，總共匹配到了三個 a：

還有一個小疑問，如果是對象構(gòu)造函數(shù)的方式來構(gòu)造正則表達(dá)式使，如何添加這些修飾符呢？其實(shí)很簡單，只要將修飾符作為第二個參數(shù)傳遞給構(gòu)造函數(shù)就可以了：

let regExp = new RegExp('[2b|^2b]', 'gi')

console.log(regExp)  // 輸出結(jié)果：/[2b|^2b]/gi

字符集合

如果我們想匹配 bat、cat 和 fat 這種類型的字符串該怎么辦？可以通過使用字符集合來做到這一點(diǎn)，用 [] 表示，它會匹配包含的任意一個字符。這里就可以使用/[bcf]at/ig：

圖片

可以看到，這里匹配到了字符串中的 bat、cat、fat。因?yàn)槲覀兪褂昧?g 修飾符，所以匹配到了三個結(jié)果。

當(dāng)然，字符集也可以用來匹配數(shù)字：

字符范圍

如果我們想要在字符串中匹配所有以 at 結(jié)尾的單詞，最直接的方式是使用字符集，并在其中提供所有的字母。對于這種在一個范圍中的字符，就可以直接定義字符范圍，用-表示。它用來匹配指定范圍內(nèi)的任意字符。這里就可以使用/[a-z]at/ig：

可以看到，正則表達(dá)式按照我們的預(yù)期匹配了。

常見的使用范圍的方式如下：

部分范圍：[a-f]，匹配 a 到 f 的任意字符；
小寫范圍：[a-z]，匹配 a 到 z 的任意字符；
大寫范圍：[A-Z]，匹配 A 到 Z 的任意字符；
數(shù)字范圍：[0-9]，匹配 0 到 9 的任意字符；
符號范圍：[#$%&@]；
混合范圍：[a-zA-Z0-9]，匹配所有數(shù)字、大小寫字母中的任意字符。

數(shù)量字符

如果想要匹配三個字母的單詞，根據(jù)上面我們學(xué)到的字符范圍，可以這樣來寫：

[a-z][a-z][a-z]

這里我們匹配的三個字母的單詞，那如果想要匹配10個、20個字母的單詞呢？難道要一個個來寫范圍嗎？有一種更好的方法就是使用花括號{}來表示，來看例子：

可以看到，這里我們匹配到了所有連續(xù)5個字母的單詞（包括超過5個字母的單詞，不過只會匹配到前5個字母）。

其實(shí)匹配重復(fù)字符的完整語法是這樣的：{m,n}，它會匹配前面一個字符至少 m 次至多 n 次重復(fù)，{m}表示匹配 m 次，{m,}表示至少 m 次。

所以，當(dāng)我們給5后面加上逗號時，就表示至少匹配五次：

所以這里就匹配到了所有連續(xù)5個或5個以上的單詞。

當(dāng)匹配次數(shù)為至少4次，至多5次時，匹配結(jié)果如下：

除了可以使用大括號來匹配一定數(shù)量的字符，還有三個相關(guān)的模式：

+：匹配前面一個表達(dá)式一次或者多次，相當(dāng)于 {1,}；
*：匹配前面一個表達(dá)式0次或者多次，相當(dāng)于 {0,}；
?：單獨(dú)使用匹配前面一個表達(dá)式零次或者一次，相當(dāng)于 {0,1}，如果跟在量詞*、+、?、后面的時候?qū)沽吭~變?yōu)榉秦澙纺Ｊ剑ūM量匹配少的字符），默認(rèn)是使用貪婪模式。

來看一個簡單的例子，這里我們匹配的正則表達(dá)式為/a+/ig，結(jié)果如下：

它和/a{1,}/ig的匹配結(jié)果是一樣的：使用/[a-z]+/ig就可以匹配任意長度的純字母單詞：

元字符

使用元字符可以編寫更緊湊的正則表達(dá)式模式。常見的元字符如下：

\d：相當(dāng)于[0-9]，匹配任意數(shù)字；
\D：相當(dāng)于[^0-9]；
\w：相當(dāng)于[0-9a-zA-Z]，匹配任意數(shù)字、大小寫字母和下劃線；
\W：相當(dāng)于：[^0-9a-zA-Z]；
\s：相當(dāng)于[\t\v\n\r\f]，匹配任意空白符，包括空格，水平制表符\t，垂直制表符\v，換行符\n，回車符\r，換頁符\f；
\S：相當(dāng)于[^\t\v\n\r\f]，表示非空白符。

來看一個簡單的例子：

這里使用\d來匹配任意數(shù)字、字母和下劃線。這里就匹配到了7個連續(xù)四位的字符。

特殊字符

使用特殊字符可以編寫更高級的模式表達(dá)式，常見的特殊字符如下：

.：匹配除了換行符之外的任何單個字符；
\：將下一個字符標(biāo)記為特殊字符、或原義字符、或向后引用、或八進(jìn)制轉(zhuǎn)義符；
|：邏輯或操作符；
[^]：取非，匹配未包含的任意字符。

來看一個簡單的例子，如果我們使用 /ab*/ig 進(jìn)行匹配，結(jié)果就如下：

那我們就是想要匹配 * 怎么辦？就可以使用 \ 對其進(jìn)行轉(zhuǎn)義：

這樣就只會匹配到 ab* 了。

或匹配也很簡單，來看例子，匹配規(guī)則為：/ab|cd/ig，匹配結(jié)果如下：

這里就會匹配到字符串中所有 ab 和 cd 字符。那如果想要匹配 sabz 或者scdz呢？開頭和結(jié)尾是相同的，只有中間的兩個字符是可選的。其實(shí)只需要給中間的或部分加上括號就可以了：取非規(guī)則在范圍中使用，來看例子：這里匹配到了所有非字母的字符。

位置匹配

如果我們想匹配字符串中以某些字符結(jié)尾的單詞，以某些字符開頭的單詞該如何實(shí)現(xiàn)呢？正則表達(dá)式中提供了方法通過位置來匹配字符：

\b：匹配一個單詞邊界，也就是指單詞和空格間的位置；
\B：匹配非單詞邊界；
^：匹配開頭，在多行匹配中匹配行開頭；
$：匹配結(jié)尾，在多行匹配中匹配行結(jié)尾；
(?=p)：匹配 p 前面的位置；
(?!=p)：匹配不是 p 前面的位置。

最常見的就是匹配開始和結(jié)束位置。先來看一個開始位置的匹配，這里使用 /^ex/igm 來匹配多行中以ex 開頭的行：

使用/e$/igm來匹配以 e 結(jié)尾的行：

可以使用 \w+$ 來匹配每一行的最后一個單詞：需要注意，這里我們都使用 m 修飾符開啟了多行模式。

使用 /(?=the)/ig 來匹配字符串中the前的面的位置：

我們可以使用\b來匹配單詞的邊界，匹配的結(jié)果如下：

這可能比較難理解，我們可以使用以下正則表達(dá)式來匹配完整的單詞：\b\w+\b，匹配結(jié)果如下：

捕獲組

正則表達(dá)式中的“捕獲組”是指使用括號 () 將子模式括起來，以便于在搜索時同時匹配多個項(xiàng)或?qū)⑵ヅ涞膬?nèi)容單獨(dú)提取出來。組可以根據(jù)需要進(jìn)行嵌套，形成復(fù)雜的匹配模式。

使用捕獲組，可以直接在正則表達(dá)式 /(Testing|tests) 123/ig 中匹配到 "Testing 123" 和 "Tests 123"，而不需要重復(fù)寫 "123" 的匹配項(xiàng)。

正則表達(dá)式中的兩種常見組類型：

(...)：捕獲組，用于匹配任意三個字符。
(?:...)：非捕獲組，也是用于匹配任意三個字符，但不進(jìn)行捕獲。

可以使用以下 JavaScript 將文本替換為Testing 234和tests 234：

const regex = /(Testing|tests) 123/ig;

let str = `
Testing 123
Tests 123
`;

str = str.replace(regex, '$1 234');
console.log(str); 
// Testing 234
// Tests 234

被括號包圍的子模式稱為“捕獲組”，捕獲組可以從匹配的字符串中提取出指定的部分并單獨(dú)使用。這里我們使用 $1 來引用第一個捕獲組 (Testing|tests)。也可以匹配多個組，比如同時匹配 (Testing|tests) 和 (123)。

const regex = /(Testing|tests) (123)/ig;

let str = `
Testing 123
Tests 123
`;

str = str.replace(regex, '$1 #$2');
console.log(str); 
// Testing #123
// Tests #123"

這只適用于捕獲組。如果把上面的正則表達(dá)式變成這樣：

/(?:Testing|tests) (123)/ig;

那么只有一個被捕獲的組：(123)，與之前相同的代碼將輸出不同的結(jié)果：

const regex = /(?:Testing|tests) (123)/ig;

let str = `
Testing 123
Tests 123
`;

str = str.replace(regex, '$1');
console.log(str);
// 123
// 123

修改后的正則表達(dá)式只有一個捕獲組 (123)。因?yàn)?nbsp;(?: ) 的語法用于創(chuàng)建非捕獲組，所以它不會將其內(nèi)容作為一個捕獲組來使用。

命名捕獲組

雖然捕獲組非常有用，但是當(dāng)有很多捕獲組時很容易讓人困惑。$3 和 $5 這些名字并不是一目了然的。為了解決這個問題，正則表達(dá)式引入了“命名捕獲組”的概念。例如，(?<name>...) 就是一個命名捕獲組，名為 "name"，用于匹配任意三個字符。

可以像這樣在正則表達(dá)式中使用它來創(chuàng)建一個名為 "num" 的組，用于匹配三個數(shù)字：

/Testing (?<num>\d{3})/

然后，可以在替換操作中像這樣使用它：

const regex = /Testing (?<num>\d{3})/
let str = "Testing 123";
str = str.replace(regex, "Hello $<num>")
console.log(str); // "Hello 123"

命名反向引用

有時候需要在查詢字符串中引用一個命名捕獲組，這就是“反向引用”的用武之地。

假設(shè)有一個字符串，其中包含多個單詞，我們想要找到所有出現(xiàn)兩次或以上的單詞?？梢允褂镁呙东@組和命名反向引用來實(shí)現(xiàn)。

const regex = /\b(?<word>\w+)\b(?=.*?\b\k<word>\b)/g;
const str = 'I like to eat pizza, but I do not like to eat sushi.';
const result = str.match(regex);
console.log(result); // like

這里使用了具名捕獲組 (?<word>\w+)來匹配單詞，并將其命名為 "word"。然后使用命名反向引用 (?=.*?\b\k<word>\b) 來查找文本中是否存在具有相同內(nèi)容的單詞。

前瞻組和后顧組

前瞻組（Lookahead）和后顧組（Lookbehind）是正則表達(dá)式中非常有用的工具，它們用于在匹配過程中進(jìn)行條件約束，而不會實(shí)際匹配這些約束的內(nèi)容。它們使得我們可以更精確地指定匹配模式。

前瞻組：

正向前瞻（(?=...)）：用于查找在某個位置后面存在的內(nèi)容。例如，A(?=B) 可以匹配 "A"，但只有在后面跟著 "B" 時才進(jìn)行匹配。
負(fù)向前瞻（(?!...)）：用于查找在某個位置后面不存在的內(nèi)容。例如，A(?!B) 可以匹配 "A"，但只有在后面不跟著 "B" 時才進(jìn)行匹配。

后顧組：

正向后顧（(?<=...)）：用于查找在某個位置前面存在的內(nèi)容。例如，(?<=A)B 可以匹配 "B"，但只有在其前面跟著 "A" 時才進(jìn)行匹配。
負(fù)向后顧（(?<!...)）：用于查找在某個位置前面不存在的內(nèi)容。例如，(?<!A)B 可以匹配 "B"，但只有在其前面不跟著 "A" 時才進(jìn)行匹配。

這些前瞻組和后顧組可以用于各種場景，例如：

在匹配郵箱地址時，使用正向前瞻來確保地址的結(jié)尾是以特定的域名結(jié)尾。
在匹配密碼時，使用正向前瞻來確保密碼滿足特定的復(fù)雜度要求。
在提取文本中的日期時，使用正向后顧來確保日期的前面有特定的前綴。

例如，使用負(fù)向前瞻可以匹配 BC，但不會匹配 BA。

/B(?!A)/

我們甚至可以將負(fù)向前瞻組合使用，并使用 ^ 和 $ 這些元字符來嘗試匹配完整的字符串。例如，以下的正則表達(dá)式將匹配任何不以 "Test" 開頭的字符串：

/^(?!Test).*$/gm

這個正則表達(dá)式可以匹配 Hello 和 Other，但無法匹配 Testing 123 和 Tests 123。

同樣，可以將其切換為正向前瞻，以強(qiáng)制字符串必須以“Test”開頭：

/^(?=Test).*$/gm

字符串方法

在 JavaScript 內(nèi)置了 6 個常用的方法是支持正則表達(dá)式的，下面來分別看看這些方法。

search()

search() 方法用于檢索字符串中指定的子字符串，或檢索與正則表達(dá)式相匹配的子字符串，并返回子串的起始位置。如果沒有找到任何匹配的子串，則返回 -1。

const regex1 = /a/ig;
const regex2 = /p/ig;
const regex3 = /m/ig;
const str = "Action speak louder than words";

console.log(str.search(regex1));  // 輸出結(jié)果：0
console.log(str.search(regex2));  // 輸出結(jié)果：8
console.log(str.search(regex3));  // 輸出結(jié)果：-1

可以看到，search() 方法只會返回匹配到的第一個字符的索引值，當(dāng)沒有匹配到相應(yīng)的值時，就會返回-1。

match()

match() 方法可在字符串內(nèi)檢索指定的值，或找到一個或多個正則表達(dá)式的匹配。如果沒有找到任何匹配的文本， match() 將返回 null。否則，它將返回一個數(shù)組，其中存放了與它找到的匹配文本有關(guān)的信息。

const regex1 = /a/ig;
const regex2 = /a/i;
const regex3 = /m/ig;
const str = "Action speak louder than words";

console.log(str.match(regex1));  // 輸出結(jié)果：['A', 'a', 'a']
console.log(str.match(regex2));  // 輸出結(jié)果：['A', index: 0, input: 'Action speak louder than words', groups: undefined]
console.log(str.match(regex3));  // 輸出結(jié)果：null

可以看到，當(dāng)沒有 g 修飾符時，就只能在字符串中執(zhí)行一次匹配，如果想要匹配所有符合條件的值，就需要添加 g 修飾符。

matchAll()

matchAll() 方法返回一個包含所有匹配正則表達(dá)式的結(jié)果及分組捕獲組的迭代器。因?yàn)榉祷氐氖潜闅v器，所以通常使用for...of循環(huán)取出。

for (const match of 'abcabc'.matchAll(/a/g)) {
    console.log(match)
}
//["a", index: 0, input: "abcabc", groups: undefined]
//["a", index: 3, input: "abcabc", groups: undefined]

需要注意，該方法的第一個參數(shù)是一個正則表達(dá)式對象，如果傳的參數(shù)不是一個正則表達(dá)式對象，則會隱式地使用 new RegExp(obj) 將其轉(zhuǎn)換為一個 RegExp 。另外，RegExp必須是設(shè)置了全局模式g的形式，否則會拋出異常 TypeError。

replace()

replace() 用于在字符串中用一些字符串替換另一些字符串，或替換一個與正則表達(dá)式匹配的子串。

const regex = /A/g;
const str = "Action speak louder than words";

console.log(str.replace(regex, 'a'));  // 輸出結(jié)果：action speak louder than words

可以看到，第一個參數(shù)中的正則表達(dá)式匹配到了字符串的第一個大寫的 A，并將其替換為了第二個參數(shù)中的小寫的 a。

replaceAll()

replaceAll() 方法用于在字符串中用一些字符替換另一些字符，或替換一個與正則表達(dá)式匹配的子串，該函數(shù)會替換所有匹配到的子字符串。

const regex = /a/g;
const str = "Action speak louder than words";

console.log(str.replaceAll(regex, 'A'));  // 輸出結(jié)果：Action speAk louder thAn words

需要注意，當(dāng)使用一個 regex 時，您必須設(shè)置全局（"g"）標(biāo)志，否則，它將引發(fā) TypeError："必須使用全局 RegExp 調(diào)用 replaceAll"。

split()

split() 方法用于把一個字符串分割成字符串?dāng)?shù)組。其第一個參數(shù)是一個字符串或正則表達(dá)式，從該參數(shù)指定的地方分割字符串。

const regex = / /gi;
const str = "Action speak louder than words";

console.log(str.split(regex));  // 輸出結(jié)果：['Action', 'speak', 'louder', 'than', 'words']

這里的 regex 用來匹配空字符串，所以最終在字符串的每個空格處將字符串拆成了數(shù)組。

七、應(yīng)用場景

上面介紹了正則表達(dá)式的用法，下面就來看看正則表達(dá)式的實(shí)際應(yīng)用場景。

數(shù)據(jù)驗(yàn)證

數(shù)據(jù)驗(yàn)證應(yīng)該是正則表達(dá)式最常見的場景了，經(jīng)常用于用戶的輸入是否符合所需的條件。數(shù)據(jù)驗(yàn)證可確保輸入或?qū)氲臄?shù)據(jù)準(zhǔn)確、一致，并符合預(yù)定義的規(guī)則。

驗(yàn)證手機(jī)號：

const phoneNumber = "13712345678";

const regex = /^1[3-9]\d{9}$/;

console.log("手機(jī)號格式正確：", regex.test(phoneNumber));

驗(yàn)證郵箱：

const email = "example@example.com";

const regex = /^[^\s@]+@[^\s@]+\.[^\s@]+$/;

console.log("電子郵件格式正確：", regex.test(email));

驗(yàn)證密碼（要求：至少包含一個數(shù)字，一個字母，一個特殊字符，長度在8~18之間）：

const password = "Abcdef.123";

const regex = /^(?=.*\d)(?=.*[a-zA-Z])(?=.*[\W_]).{8,18}$/;

console.log("密碼格式正確：", regex.test(password))

驗(yàn)證輸入內(nèi)容不能包含 emoji 表情：

function hasEmoji(str) {
  const emojiRegex = /[\uD800-\uDFFF]|[\u2600-\u27FF]|[\u1F000-\u1F9FF]/g;
  return emojiRegex.test(str);
}

// 測試樣例
const text1 = 'Hello, world!';
const text2 = '你好，??！';
console.log(hasEmoji(text1)); // false
console.log(hasEmoji(text2)); // true

搜索和替換

搜索和替換是正則表達(dá)式的很常見的用例。它允許查找文本中的特定模式并將其替換為所需的內(nèi)容。

筆者之前做個一個需求：

獲取 HTML 字符串中所有圖片，也就是獲取所有 img 標(biāo)簽的 src 屬性值，這個需求屬于數(shù)據(jù)提取，第三部分會講到；
將獲取到的圖片轉(zhuǎn)灰度圖，轉(zhuǎn)灰度成功的圖片的名稱會加一個-gray后綴，將這個圖片替換 HTML 原來的圖片。也就將轉(zhuǎn)換成功的圖片的src地址加-gray后綴。

灰度圖替換：

const grayImgReplace = (html: string, imgUrl: string) => {
    const regex = /(https?:\/\/[^\s"']+\.[^\s"']+(?<!-gray))\.(jpg|jpeg|png)/;
    const match = regex.exec(html);
    if (match) {
        return html.replace(match[0], `${imgUrl}`);
    }
    return html;
};

注意：這里僅替換一張圖，若需要替換多張，每個圖片都執(zhí)行該方法即可。

另一個例子就是在 IDE 中進(jìn)行正則表達(dá)式搜索和替換操作。比如，在 VS Code 中，只需在搜索欄中點(diǎn)擊搜索欄左側(cè)的正則表達(dá)式按鈕（.*）或按下快捷鍵 Alt + R，就可以激活正則表達(dá)式搜索模式。

比如，有一個動態(tài)接口路徑：/app/api/:modal/list，想要看看哪些地方調(diào)用了這個接口。這個路徑中間的 modal 是動態(tài)的，沒辦法直接通過字符串進(jìn)行搜索，怎么辦呢？可以借助正則表達(dá)式輕松實(shí)現(xiàn)：

\/app\/api\/([^\/]+)\/list

不管 modal 是什么，都可以輕松搜索到：

除此之外，還可以通過搜索替換輕松實(shí)現(xiàn)數(shù)據(jù)的格式化。例如，將數(shù)字轉(zhuǎn)換為貨幣格式：

const formatMoney = (money) => {
  return money.replace(new RegExp(`(?!^)(?=(\\d{3})+${money.includes('.') ? '\\.' : '$'})`, 'g'), ',')  
}

formatMoney('123456789') // '123,456,789'
formatMoney('123456789.123') // '123,456,789.123'
formatMoney('123') // '123'

數(shù)據(jù)提取

數(shù)據(jù)提取是正則表達(dá)式的另一個常見用例。正則表達(dá)式使我們能夠根據(jù)定義的模式從較大的文本中有效地提取特定信息。

上面提到了從 HTML 字符串中獲取所有圖片 URL 的需求，下面來實(shí)現(xiàn)一下：

const getImgs = (domContent) => {
  const imgs = [];
  const imgPattern = /<img[^>]+src=['"]((?!.*\.svg).+?)['"]/g;

  let match = null;
  while ((match = imgPattern.exec(domContent)) !== null) {
    imgs.push(match[1]);
  }

  return imgs;
};

再比如，獲取所有 a 標(biāo)簽鏈接，也就是獲取 href 屬性值：

const html = '<a >Link 1</a> <a >Link 2</a>';

// 使用正則表達(dá)式提取 <a> 標(biāo)簽鏈接
const linkRegex = /<a\s+(?:[^>]*?\s+)?href=(["'])(.*?)\1/g;
const links = [];
let match;

while ((match = linkRegex.exec(html)) !== null) {
  const link = match[2];
  links.push(link);
}

console.log(links);

輸出結(jié)果如下：

[
  'https://www.example.com',
  'https://www.google.com'
]

再比如，提取 URL 中的域名：

const url = 'https://www.example.com/path/to/page?param1=value1?m2=value2#section';
const domainRegex = /https?:\/\/([\w.-]+)/;
const match = url.match(domainRegex);
const domain = match && match[1];

console.log(domain); // www.example.com

數(shù)據(jù)清洗

通過適當(dāng)使用正則表達(dá)式，可以輕松地從文本數(shù)據(jù)中查找、匹配和替換特定的模式和字符，從而對數(shù)據(jù)進(jìn)行清理和預(yù)處理。以下是一些常見的數(shù)據(jù)清洗任務(wù)，可以使用正則表達(dá)式來完成：

移除多余空格：使用正則表達(dá)式將連續(xù)的多個空格或制表符替換為單個空格，或者完全移除所有空格。
格式化日期：使用正則表達(dá)式解析和提取日期字符串，并將其格式化為指定的格式或日期對象。
清除特殊字符：使用正則表達(dá)式從文本數(shù)據(jù)中移除不需要的特殊字符和標(biāo)點(diǎn)符號，例如 emoji 表情符號、HTML 標(biāo)簽、URL 等。
提取信息：使用正則表達(dá)式從文本數(shù)據(jù)中提取特定的信息，例如電話號碼、郵件地址、IP 地址等。
替換錯誤或不一致的數(shù)據(jù)：使用正則表達(dá)式查找和替換文本數(shù)據(jù)中的錯誤拼寫、大小寫、顛倒順序等問題，使得數(shù)據(jù)更加一致和規(guī)范化。

比如，刪除字符串中的標(biāo)簽和 emoji 表情：

const text = 'Hello, <b>world</b>! ??';
const cleanText = text.replace(/<\/?[^>]+(>|$)/g, '').replace(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g, '');

console.log(cleanText); // Hello, world!

這里使用了兩個正則表達(dá)式替換操作：

/<\/?[^>]+(>|$)/g：這個正則表達(dá)式用于匹配并移除 HTML 標(biāo)簽。它會匹配尖括號內(nèi)的任何內(nèi)容，并將其替換為空字符串。
/[\uD800-\uDBFF][\uDC00-\uDFFF]/g：這個正則表達(dá)式用于匹配并移除 emoji 表情符號。由于 emoji 符號采用 Unicode 編碼的多個字符表示，我們使用這個正則表達(dá)式匹配并移除這些字符。

八、實(shí)用工具

Regex101

Regex101 是學(xué)習(xí)正則表達(dá)式最有效的工具網(wǎng)站之一，本文的示例使用的就是這個工具。在REGULAR EXPRESSION欄中可以輸入正則表達(dá)式，可以在輸入框右側(cè)選擇需要的修飾符，在下面的TEST STRING欄中輸入要測試的字符串，即可顯示出匹配到的結(jié)果。在右側(cè)的EXPLANATION區(qū)域會顯示出對輸入的正則表達(dá)式的詳細(xì)解釋。右下角的 QUICK REFERENCE 欄會顯示正則表達(dá)式速查表。

Regex101 還支持在上面練習(xí)編寫正則表達(dá)式：

可以在上面搜索一些正則表達(dá)式的庫：

除此之外，我們還可以使用 RegexDebugger 來跟蹤匹配的過程。更多功能可以在Regex101 上進(jìn)行探索。

官網(wǎng)：https://regex101.com/

RegExr

RegExr 是一個基于 JavaScript 開發(fā)的在線工具，用來創(chuàng)建、測試和學(xué)習(xí)正則表達(dá)式。它是一個開源的工具，具有以下特性：

輸入時，結(jié)果會實(shí)時更新；
支持 JavaScript 和 PHP/PCRE RegEx；
將匹配項(xiàng)或表達(dá)式移至詳細(xì)信息；
保存并與他人共享表達(dá)式；
使用工具探索結(jié)果；
瀏覽參考以獲取幫助和示例；
在編輯器中使用 cmd-Z/Y 撤消和重做。

官網(wǎng)：https://regexr.com/

Regex Pal

Regexpal 是一個基于 Javascript 的在線正則表達(dá)式驗(yàn)證工具。它的頁面非常簡潔，只有兩個輸入框，上面的輸入框中可以輸入正則表達(dá)式（匹配規(guī)則），下面的輸入框可以輸入待匹配的數(shù)據(jù)。此外，根據(jù)具體要求，還可以設(shè)置忽略大小寫、多行匹配等參數(shù)。

官網(wǎng)：https://www.regexpal.com/

Regex-Vis

Regex-Vis 是一個輔助學(xué)習(xí)、編寫和驗(yàn)證正則的工具。它不僅能對正則進(jìn)行可視化展示，而且提供可視編輯正則的能力。在輸入一個正則表達(dá)式后，會生成它的可視化圖形。然后可以點(diǎn)選或框選圖形中的單個或多個節(jié)點(diǎn)，再在右側(cè)操作面板對其進(jìn)行操作，具體操作取決于節(jié)點(diǎn)的類型，比如在其右側(cè)插入空節(jié)點(diǎn)、為節(jié)點(diǎn)編組、為節(jié)點(diǎn)增加量詞等。

官網(wǎng)：https://regex-vis.com/

Regex previewer

Regex previewer 是一個 VScode 插件，在插件市場搜索名稱即可安裝。當(dāng)我們在編寫正則表達(dá)式時，可以直接使用快捷鍵 Ctrl+Alt+M （windows）或者 ?+?+M（Mac）在編輯器右側(cè)啟動一個標(biāo)簽頁，我們可以在這個標(biāo)簽頁寫一寫測試用例，用來測試我們寫的正則表達(dá)式，寫完字符串用例之后，點(diǎn)擊我們編寫的正則表達(dá)式上方的 Test Regex...即可，這樣右側(cè)匹配到字符就會高亮顯示了，如下圖：

責(zé)任編輯：武曉燕來源：前端充電寶

正則表達(dá)式模式

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營