快速掌握grep命令及正則表達(dá)式

作者：cyberciti 2016-09-12 09:57:08

如何在Linux系統(tǒng)和類Unix的操作系統(tǒng)中使用帶正則表達(dá)式的grep命令呢?下面給大家詳細(xì)介紹一下。

Linux系統(tǒng)自帶了支持拓展正則表達(dá)式的 GNU 版本 grep 工具，所有的Linux發(fā)行版中均默認(rèn)安裝grep ，grep 命令被用來(lái)檢索一臺(tái)服務(wù)器或工作站上任何位置的文本信息，如何在 Linux 系統(tǒng)和類 Unix 的操作系統(tǒng)中使用帶正則表達(dá)式的 grep 命令呢?

快速了解正則表達(dá)式

1、如何匹配你要查找的內(nèi)容?

正則表達(dá)式只不過(guò)是每個(gè)輸入行匹配的模式。

在 ‘/etc/passswd’ 中檢索 ‘vivek’ 。

grep vivek /etc/passwd

輸出結(jié)果案例：

vivek:x:1000:1000:Vivek Gite,,,:/home/vivek:/bin/bash 
 
vivekgite:x:1001:1001::/home/vivekgite:/bin/sh 
 
gitevivek:x:1002:1002::/home/gitevivek:/bin/sh

在任何情況下都搜索 ‘vivek’ (即不區(qū)分大小)：

grep -i -w vivek /etc/passwd

不區(qū)分大小寫地檢索 ‘vivek’ 和 ‘raj’ ：

grep -E -i -w 'vivek|raj' /etc/passwd

在***一個(gè)例子中，使用了擴(kuò)展正則表達(dá)式的模式。

固定檢索內(nèi)容的位置：

你可以使用 ^ 和 $ 符號(hào)強(qiáng)制一個(gè)正則表達(dá)式分別匹配一行的開(kāi)始或結(jié)束的位置。下面的示例顯示以 ‘vivek’ 開(kāi)頭的文本。

grep ^vivek /etc/passwd

輸出結(jié)果示例：

vivek:x:1000:1000:Vivek Gite,,,:/home/vivek:/bin/bash 
 
vivekgite:x:1001:1001::/home/vivekgite:/bin/sh

你可以只顯示以 vivek 開(kāi)頭的文本行。舉例說(shuō)就是不顯示 vivekgite , vivekg 這樣單詞開(kāi)頭的。

grep -w ^vivek /etc/passwd

檢索以 ‘foo’ 結(jié)尾的文本格式：

grep 'foo$' FILENAME

你還可以用下面這樣的方式搜索空白行：

grep '^$' FILENAME

2、如何匹配具體字符?

匹配 ‘Vivek’ 或 ‘vivek’ ：

grep '[vV]ivek' FILENAME

或者可以這樣：

grep '[vV][iI][Vv][Ee][kK]' FILENAME

你可以匹配數(shù)字(例如匹配 vivek1 或 Vivek2 )：

grep -w '[vV]ivek[0-9]' FILENAME

你可以匹配兩位數(shù)(例如匹配 foo11 ， foo12 )：

grep 'foo[0-9][0-9]' FILENAME

不僅僅是數(shù)字，你可以匹配字母：

grep '[A-Za-z]' FILENAME

顯示所有包含 “w” 或 “n” 字母的文本行：

grep [wn] FILENAME

在括號(hào)內(nèi)的表達(dá)式中，在“ [: ”和“ :] ”中所附的字符類的名稱：代表屬于該類的所有字符的列表。標(biāo)準(zhǔn)字符類名稱：

[:alnum:] – 字母數(shù)字字符。 
 
[:alpha:] – 字母順序 
 
[:blank:] – 空格和制表符。 
 
[:digit:] – 數(shù)字： ‘0 1 2 3 4 5 6 7 8 9’。 
 
[:lower:] – 小寫字母：‘a b c d e f ‘。 
 
[:space:] – 特殊字符：制表符，換行符，垂直制表符、換頁(yè)，回車，和空間。 
 
[:upper:] – 大寫字母：‘A B C D E F G H I J K L M N O P Q R S T U V W X Y Z’。

在下面這個(gè)例子中，匹配所有大寫字母：

grep '[:upper:]' FILENAME

3、如何使用通配符?

你可以用 “.” 來(lái)代替單個(gè)字符。在下面的例子中，查詢了所有以字母 “b” 開(kāi)頭、字母 “t” 結(jié)尾的三個(gè)字符的單詞。

grep '\<b.t\>' FILENAME

在上面的例子中:

\< 在單詞的開(kāi)始位置匹配空格字符串

\> 在單詞的結(jié)尾匹配空格字符串

檢索并輸出所有兩個(gè)字母的結(jié)果：

grep '^..$' FILENAME

檢索并顯示所有以 ‘.’ 和數(shù)字開(kāi)頭的結(jié)果：

grep '^\.[0-9]' FILENAME

轉(zhuǎn)義字符’.’

下面的正則表達(dá)式查找 IP 地址 192.168.1.254 將不能獲得預(yù)期的結(jié)果：

grep '192.168.1.254' /etc/hosts

其中三個(gè)點(diǎn)都需要被轉(zhuǎn)義：

grep '192\.168\.1\.254' /etc/hosts

以下示例將只匹配一個(gè)地址：

egrep '[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}' FILENAME

以下將不分大小寫地匹配單詞 Linux 或 Unix ：

egrep -i '^(linux|unix)' FILENAME

深入探索 grep 高級(jí)查找模式

1、如何檢索一個(gè)具有以 ‘-‘ 開(kāi)頭的的模式?

使用 -e 選項(xiàng)搜索所有匹配 ‘–test–‘ 的結(jié)果。grep 會(huì)嘗試把 ‘–test–‘ 作為一個(gè)選項(xiàng)解析：

grep -e '--test--' FILENAME

2、如何在grep中使用 OR 的邏輯運(yùn)算 ?

grep -E 'word1|word2' FILENAME### OR ###egrep 'word1|word2' FILENAME

或者可以這樣做

grep 'word1\|word2' FILENAME

3、如何在grep中使用 AND 的邏輯運(yùn)算 ?

按照下面的語(yǔ)法顯示所有包含了單詞 ‘word1′ 和 ‘word2′ 的結(jié)果：

grep 'word1' FILENAME | grep 'word2'

或者可以這樣：

grep 'foo.*bar\|word3.*word4' FILENAME

4、如何測(cè)試序列?

你可以使用下面的語(yǔ)法測(cè)試一個(gè)字符在序列中的重復(fù)的次數(shù)：

{N} 
 
{N,} 
 
{min,max}

匹配包含兩個(gè)字母 v 的字符串結(jié)果：

egrep "v{2}" FILENAME

下面的例子中將檢索文件內(nèi)包含 “col” 和 “cool” 的字符串結(jié)果：

egrep 'co{1,2}l' FILENAME

下面的例子中將匹配至少含有3個(gè)字母 c 的結(jié)果：

egrep 'c{3,}' FILENAME

下面的示例將匹配 “91-1234567890″ 格式的手機(jī)號(hào)碼(即 “兩位數(shù)字-十位數(shù)字”)

grep "[[:digit:]]\{2\}[ -]\?[[:digit:]]\{10\}" FILENAME

5、如何使 grep 的輸出結(jié)果高亮標(biāo)注?

使用下面例子的語(yǔ)法：

grep --color regex FILENAME

6、如何使 grep 的輸出只顯示匹配的部分而不是整行?

使用下面例子的語(yǔ)法：

grep -o regex FILENAME

正則表達(dá)式操作符總結(jié)

正則表達(dá)式:操作符含義

 匹配任何單個(gè)字符。 
 
? 匹配前一個(gè)字符0次或1次。 
 
* 匹配前一個(gè)字符≥0次。 
 
+ 匹配前一個(gè)字符≥1次。 
 
{N} 匹配前一個(gè)字符N次。 
 
{N,} 匹配前一個(gè)字符≥m次。 
 
{N,M} 匹配前一個(gè)字符 N 到 M次。 
 
– 如果在列表中的某個(gè)列表或某個(gè)范圍內(nèi)的結(jié)束點(diǎn)，表示該范圍。 
 
^ 開(kāi)始標(biāo)記，表示在開(kāi)始位置匹配一個(gè)空字符串。也表示不在列表的范圍內(nèi)的字符。 
 
$ 結(jié)束標(biāo)記。匹配一個(gè)空的字符串。 
 
\b 單詞鎖定符。在一個(gè)單詞的邊緣位置匹配空字符串。 
 
\B 在一個(gè)單詞的非邊緣位置匹配空字符串。 
 
\< 匹配單詞開(kāi)始的空字符串。 
 
\> 匹配單詞結(jié)尾的空字符串。

關(guān)于 grep 和 egrep

egrep 即 grep -E ，它把模式作為一個(gè)擴(kuò)展的正則表達(dá)式解釋。grep 幫助文檔中這樣定義： 
 
In basic regular expressions the meta-characters ?, +, {, |, (, and ) lose their special meaning; instead use the backslashed versions \?, \+, \{,\|, \(, and \). 
 
Traditional egrep did not support the { meta-character, and some egrep implementations support \{ instead, so portable scripts should avoid { in 
 
grep -E patterns and should use [{] to match a literal {. 
 
GNU grep -E attempts to support traditional usage by assuming that { is not special if it would be the start of an invalid interval specification. 
 
For example, the command grep -E '{1' searches for the two-character string {1 instead of reporting a syntax error in the regular expression. 
 
POSIX.2 allows this behavior as an extension, but portable scripts should avoid it.