Linux三劍客之a(chǎn)wk詳解
***篇 awk簡介與表達(dá)式實(shí)例
-
一種名字怪異的語言
-
模式掃描和處理,處理數(shù)據(jù)和生成報(bào)告。
awk不僅僅是linux系統(tǒng)中的一個(gè)命令,而且是一種編程語言;它可以用來處理數(shù)據(jù)和生成報(bào)告(excel);處理的數(shù)據(jù)可以是一個(gè)或多個(gè)文件;可以是直接來自標(biāo)準(zhǔn)輸入,也可以通過管道獲取標(biāo)準(zhǔn)輸入;awk可以在命令行上直接編輯命令進(jìn)行操作,也可以編寫成awk程序來進(jìn)行更為復(fù)雜的運(yùn)用。
sed處理stream editor文本流,水流。
一、awk環(huán)境簡介
本文涉及的awk為gawk,即GNU版本的awk。
- [root@creditease awk]# cat /etc/redhat-release
- CentOS Linux release 7.5.1804 (Core)
- [root@creditease awk]# uname -r
- 3.10.0-862.el7.x86_64
- [root@creditease awk]# ll `which awk`
- lrwxrwxrwx. 1 root root 4 Nov 7 14:47 /usr/bin/awk -> gawk
- [root@creditease awk]# awk --version
- GNU Awk 4.0.2
二、awk的格式
awk指令是由模式、動作,或者模式和動作的組合組成。
-
模式即pattern,可以類似理解成sed的模式匹配,可以由表達(dá)式組成,也可以是兩個(gè)正斜杠之間的正則表達(dá)式。比如NR==1,這就是模式,可以把它理解為一個(gè)條件。
-
動作即action,是由在大括號里面的一條或多條語句組成,語句之間使用分號隔開。如下awk使用格式。
三、記錄和域
名稱 | 含義 |
---|---|
record | 記錄,行 |
filed | 域,區(qū)域,字段,列 |
1)NF(number of field)表示一行中的區(qū)域(列)數(shù)量,$NF取***一個(gè)區(qū)域。
2)$符號表示取某個(gè)列(區(qū)域),$1,$2,$NF
3)NR (number of record) 行號,awk對每一行的記錄號都有一個(gè)內(nèi)置變量NR來保存,每處理完一條記錄NR的值就會自動+1
4)FS(-F)field separator 列分隔符,以什么把行分隔成多列
3.1 指定分隔符
- [root@creditease awk]# awk -F "#" '{print $NF}' awk.txt
- GKL$123
- GKL$213
- GKL$321
- [root@creditease awk]# awk -F '[#$]' '{print $NF}' awk.txt
- 123
- 213
- 321
3.2 條件動作基本的條件和動作
- [root@creditease awk]# cat awk.txt
- ABC#DEF#GHI#GKL$123
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- [root@creditease awk]# awk -F "#" 'NR==1{print $1}' awk.txt
- ABC
3.3 只有條件
- [root@creditease awk]# awk -F "#" 'NR==1' awk.txt
- BC#DEF#GHI#GKL$123
默認(rèn)會有動作{print $0}
3.4 只有動作
- [root@creditease awk]# awk -F "#" '{print $1}' awk.txt
- ABC
- BAC
- CAB
默認(rèn)處理所有行
3.5 多個(gè)模式和動作
- [root@creditease awk]# awk -F "#" 'NR==1{print $NF}NR==3{print $NF}' awk.txt
- GKL$123
- GKL$321
3.6 對$0的認(rèn)識
awk中$0表示整行
- [root@creditease awk]# awk '{print $0}' awk_space.txt
- ABC DEF GHI GKL$123
- BAC DEF GHI GKL$213
- CBA DEF GHI GKL$321
3.7 FNR
FNR與NR類似,不過多文件記錄不遞增,每個(gè)文件都從1開始(后邊處理多文件會講到)
- [root@creditease awk]# awk '{print NR}' awk.txt awk_space.txt
- 1
- 2
- 3
- 4
- 5
- 6
- [root@creditease awk]# awk '{print FNR}' awk.txt awk_space.txt
- 1
- 2
- 3
- 1
- 2
- 3
四、正則表達(dá)式與操作符
awk同sed一樣也可以通過模式匹配來對輸入的文本進(jìn)行匹配處理。 awk也支持大量的正則表達(dá)式模式,大部分與sed支持的元字符類似,而且正則表達(dá)式是玩轉(zhuǎn)三劍客的必備工具。
awk支持的正則表達(dá)式元字符
awk默認(rèn)不支持的元字符,和需要添加參數(shù)才能支持的元字符
元字符 | 功能 | 示例 | 解釋 |
---|---|---|---|
x{m} | x重復(fù)m次 | /cool{5}/ | 需要注意一點(diǎn)的是,cool加括號或不加括號的區(qū)別,x可以使字符串也可以只是一個(gè)字符,所以/cool{5}/表示匹配coo再加上5個(gè)l,即coolllll。/(cool){2,}/表示匹配coolcool,coolcoolcool等。 |
x{m,} | x重復(fù)至少m次 | /(cool){2,}/ | 同上 |
x{m,n} | x重復(fù)至少m次,但不超過n次,需要指定參數(shù):--posix或者--re-interval。沒有該參數(shù)不能使用這種模式 | /(cool){5,6}/ | 同上 |
正則表達(dá)式的運(yùn)用,默認(rèn)是在行內(nèi)查找匹配的字符串,若有匹配則執(zhí)行action操作,但是有時(shí)候僅需要固定的列表匹配指定的正則表達(dá)式。
比如:
我想取/etc/passwd文件中第五列($5)這一列查找匹配mail字符串的行,這樣就需要用另外兩個(gè)匹配操作符。并且awk里面只有這兩個(gè)操作符來匹配正則表達(dá)式的。
正則匹配操作符 | |
---|---|
~ | 用于對記錄或區(qū)域的表達(dá)式進(jìn)行匹配。 |
!~ | 用于表達(dá)與~相反的意思。 |
4.1 正則實(shí)例
1)顯示awk.txt中GHI列
- [root@creditease awk]# cat awk.txt
- ABC#DEF#GHI#GKL$123
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- [root@creditease awk]# awk -F "#" '{print $3}' awk.txt
- GHI
- GHI
- GHI
- [root@creditease awk]# awk -F "#" '{print $(NF-1)}' awk.txt
- GHI
- GHI
- GHI
2)顯示包含321的行
- [root@creditease awk]# awk '/321/{print $0}' awk.txt
- CBA#DEF#GHI#GKL$321
3)以#為分隔符,顯示***列以B開頭或***一列以1結(jié)尾的行
- [root@creditease awk]# awk -F "#" '$1~/^B/{print $0}$NF~/1$/{print $0}' awk.txt
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
4)以#為分隔符,顯示***列以B或C開頭的行
- [root@creditease awk]# awk -F "#" '$1~/^B|^C/{print $0}' awk.txt
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- [root@creditease awk]# awk -F "#" '$1~/^[BC]/{print $0}' awk.txt
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- [root@creditease awk]# awk -F "#" '$1~/^(B|C)/{print $0}' awk.txt
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- [root@creditease awk]# awk -F "#" '$1!~/^A/{print $0}' awk.txt
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
五、比較表達(dá)式
awk是一種編程語言,能夠進(jìn)行更為復(fù)雜的判斷,當(dāng)條件為真時(shí),awk就執(zhí)行相關(guān)的action,主要是在針對某一區(qū)域做出相關(guān)的判斷,比如打印成績在80分以上的,這樣就必須對這一個(gè)區(qū)域作比較判斷.
下表列出了awk可以使用的關(guān)系運(yùn)算符,可以用來比較數(shù)字字符串,還有正則表達(dá)式,當(dāng)表達(dá)式為真的時(shí)候,表達(dá)式結(jié)果為1,否則為0,只有表達(dá)式為真,awk才執(zhí)行相關(guān)的action。
awk支持的關(guān)系運(yùn)算符
運(yùn)算符 | 含義 | 示例 |
---|---|---|
< | 小于 | x>y |
<= | 小于或等于。 | x<=y |
== | 等于 | x==y |
!= | 不等于 | x!=y |
>= | 大于或等于 | x>=y |
> | 大于 | x<y |
5.1 比較表達(dá)式實(shí)例
顯示awk.txt的第2 ,3 行
NR //,//
- [root@creditease awk]# awk 'NR==2{print $0}NR==3{print $0}' awk.txt
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- [root@creditease awk]# awk 'NR>=1{print $0}' awk.txt
- ABC#DEF#GHI#GKL$123
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- [root@creditease awk]# awk '/BAC/,/CBA/{print $0}' awk.txt
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
第二篇 awk模塊、變量與執(zhí)行
完整awk結(jié)構(gòu)圖如下:
一、BEGIN模塊
BEGIN模塊在awk讀取文件之前就執(zhí)行,BEGIN模式常常被用來修改內(nèi)置變量ORS,RS,F(xiàn)S,OFS等的值??梢圆唤尤魏屋斎胛募?/p>
二、awk內(nèi)置變量(預(yù)定義變量)
變量名 | 屬性 |
---|---|
$0 | 當(dāng)前記錄,一整行 |
$1,$2,$3....$a | 當(dāng)前記錄的第n個(gè)區(qū)域,區(qū)域間由FS分隔。 |
FS | 輸入?yún)^(qū)域分隔符,默認(rèn)是空格。field separator |
NF | 當(dāng)前記錄中的區(qū)域個(gè)數(shù),就是有多少列。number of field |
NR | 已經(jīng)讀出的記錄數(shù),就是行號,從1開始。number of record |
RS | 輸入的記錄分隔符默認(rèn)為換行符。record separator |
OFS | 輸出區(qū)域分隔符,默認(rèn)也是空格。output record separator |
FNR | 當(dāng)前文件的讀入記錄號,每個(gè)文件重新計(jì)算。 |
FILENAME | 當(dāng)前正在處理的文件的文件名 |
特別提示:FS RS支持正則表達(dá)式
2.1 ***個(gè)作用: 定義內(nèi)置變量
- [root@creditease awk]# awk 'BEGIN{RS="#"}{print $0}' awk.txt
- ABC
- DEF
- GHI
- GKL$123
- BAC
- DEF
- GHI
- GKL$213
- CBA
- DEF
- GHI
- GKL$321
2.2 第二個(gè)作用:打印標(biāo)識
- [root@creditease awk]# awk 'BEGIN{print "=======start======"}{print $0}' awk.txt
- =======start======
- ABC#DEF#GHI#GKL$123
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
2.3 awk實(shí)現(xiàn)計(jì)算功能
- [root@creditease files]# awk 'BEGIN{a=8;b=90;print a+b,a-c,a/b,a%b}'
- 8 8 0.0888889 8
三、END模塊
END在awk讀取完所有的文件的時(shí)候,再執(zhí)行END模塊,一般用來輸出一個(gè)結(jié)果(累加,數(shù)組結(jié)果)。也可以是和BEGIN模塊類似的結(jié)尾標(biāo)識信息。
3.1 ***個(gè)作用:打印標(biāo)識
- [root@creditease awk]# awk 'BEGIN{print "=======start======"}{print $0}END{print "=======end======"}' awk.txt
- =======start======
- ABC#DEF#GHI#GKL$123
- BAC#DEF#GHI#GKL$213
- CBA#DEF#GHI#GKL$321
- =======end======
3.2 第二個(gè)作用:累加
1)統(tǒng)計(jì)空行(/etc/services文件)
grep sed awk
- [root@creditease awk]# grep "^$" /etc/services |wc -l
- 17
- [root@creditease awk]# sed -n '/^$/p' /etc/services |wc -l
- 17
- [root@creditease awk]# awk '/^$/' /etc/services |wc -l
- 17
- [root@creditease awk]# awk '/^$/{i=i+1}END{print i}' /etc/services
- 17
2)算術(shù)題
1+2+3......+100=5050,怎么用awk表示?
- [root@creditease awk]# seq 100|awk '{i=i+$0}END{print i}'
- 5050
四、awk詳解小結(jié)
1、BEGIN和END模塊只能有一個(gè),BEGIN{}BEGIN{}或者END{}END{}都是錯(cuò)誤的。
2、找誰干啥模塊,可以是多個(gè)。
五、awk執(zhí)行過程總結(jié)
awk執(zhí)行過程:
1、命令行的賦值(-F或-V)
2、執(zhí)行BEGIN模式里面的內(nèi)容
3、開始讀取文件
4、判斷條件(模式)是否成立
- 成立則執(zhí)行對應(yīng)動作里面的內(nèi)容
- 讀取下一行,循環(huán)判斷
- 直到讀取到***一個(gè)文件的結(jié)尾
5、***執(zhí)行END模式里面的內(nèi)容
第三篇:awk數(shù)組與語法
一、awk數(shù)組
1.1 數(shù)組結(jié)構(gòu)
people[police]=110
people[doctor]=120
- [root@creditease awk]# awk 'BEGIN{word[0]="credit";word[1]="easy";print word[0],word[1]}'
- credit easy
- [root@creditease awk]# awk 'BEGIN{word[0]="credit";word[1]="easy";for(i in word)print word[i]}'
- credit
- easy
1.2 數(shù)組分類
索 引數(shù)組:以數(shù)字為下標(biāo)
關(guān)聯(lián)數(shù)組:以字符串為下標(biāo)
1.3 awk關(guān)聯(lián)數(shù)組
現(xiàn)有如下文本,格式如下:即左邊是隨機(jī)字母,右邊是隨機(jī)數(shù)字, 即將相同的字母后面的數(shù)字加在一起,按字母的順序輸出
- a 1
- b 3
- c 2
- d 7
- b 5
- a 3
- g 2
- f 6
以$1為下標(biāo),創(chuàng)建數(shù)組a[$1]=a[$1]+$2(a[$1]+=$2)然后配合END和for循環(huán)輸出結(jié)果:
- [root@creditease awk]# awk '{a[$1]=a[$1]+$2}END{for(i in a)print i,a[i]}' jia.txt
- a 4
- b 8
- c 2
- d 7
- f 6
- g 2
- 注意:for(i in a) 循環(huán)的順序不是按照文本內(nèi)容的順序來處理的,排序可以在命令后加sort排序
1.4 awk索引數(shù)組
以數(shù)字為下標(biāo)的數(shù)組 seq生成1-10的數(shù)字,要求只顯示計(jì)數(shù)行
- [root@creditease awk]# seq 10|awk '{a[NR]=$0}END{for(i=1;i<=NR;i+=2){print a[i]}}'
- 1
- 3
- 5
- 7
- 9
seq生成1-10的數(shù)字,要求不顯示文件的后3行
- [root@creditease awk]# seq 10|awk '{a[NR]=$0}END{for(i=1;i<=NR-3;i++){print a[i]}}'
- 1
- 2
- 3
- 4
- 5
- 6
- 7
解析:改變i的范圍即可,多用于不顯示文件的后幾行
1.5 awk數(shù)組實(shí)戰(zhàn)去重
a++ 和 ++a
- [root@creditease awk]# awk 'BEGIN{print a++}'
- 0
- [root@creditease awk]# awk 'BEGIN{print ++a}'
- 1
- [root@creditease awk]# awk 'BEGIN{a=1;b=a++;print a,b}'
- 2 1
- [root@creditease awk]# awk 'BEGIN{a=1;b=++a;print a,b}'
- 2 2
- 注:
- 都是 b = a+1
- b=a++ 先把 a 的值賦予b,然后 a + 1
- b=++a 先執(zhí)行a+1,然后把a(bǔ)的值賦予b
對一下文本進(jìn)行去重處理 針對第二列去重
- [root@creditease awk]# cat qc.txt
- 2018/10/20 xiaoli 13373305025
- 2018/10/25 xiaowang 17712215986
- 2018/11/01 xiaoliu 18615517895
- 2018/11/12 xiaoli 13373305025
- 2018/11/19 xiaozhao 15512013263
- 2018/11/26 xiaoliu 18615517895
- 2018/12/01 xiaoma 16965564525
- 2018/12/09 xiaowang 17712215986
- 2018/11/24 xiaozhao 15512013263
- 解法一:
- [root@creditease awk]# awk '!a[$2]++' qc.txt
- 2018/10/20 xiaoli 13373305025
- 2018/10/25 xiaowang 17712215986
- 2018/11/01 xiaoliu 18615517895
- 2018/11/19 xiaozhao 15512013263
- 2018/12/01 xiaoma 16965564525
- 解析:
- !a[$3]++是模式(條件),命令也可寫成awk '!
- a[$3]=a[$3]+1{print $0}' qc.txt
- a[$3]++ ,“++”在后,先取值后加一
- !a[$3]=a[$3]+1:是先取a[$3]的值,比較“!a[$3]”是否符合條件(條件非0),后加1
- 注意:此方法去重后的結(jié)果顯示的是文本開頭開始的所有不重復(fù)的行
- 解法二:
- [root@creditease awk]# awk '++a[$2]==1' qc.txt
- 2018/10/20 xiaoli 13373305025
- 2018/10/25 xiaowang 17712215986
- 2018/11/01 xiaoliu 18615517895
- 2018/11/19 xiaozhao 15512013263
- 2018/12/01 xiaoma 16965564525
- 解析:
- ++a[$3]==1是模式(條件),也可寫成a[$3]=a[$3]+1==1即只有當(dāng)條件(a[$3]+1的結(jié)果)為1的時(shí)候才打印出內(nèi)容
- ++a[$3] ,“++”在前,先加一后取值
- ++a[$3]==1:是先加1,后取a[$3]的值,比較“++a[$3]”是否符合條件(值為1)
- 注意:此方法去重后的結(jié)果顯示的是文本開頭開始的所有不重復(fù)的行
- 解法三:
- [root@creditease awk]# awk '{a[$2]=$0}END{for(i in a){print a[i]}}' qc.txt
- 2018/11/12 xiaoli 13373305025
- 2018/11/26 xiaoliu 18615517895
- 2018/12/01 xiaoma 16965564525
- 2018/12/09 xiaowang 17712215986
- 2018/11/24 xiaozhao 15512013263
- 解析:
- 注意此方法去重后的結(jié)果顯示的是文本結(jié)尾開始的所有不重復(fù)的行
1.6 awk處理多個(gè)文件(數(shù)組、NR、FNR)
使用awk取file.txt的***列和file1.txt的第二列然后重定向到一個(gè)新文件new.txt中
- [root@creditease awk]# cat file1.txt
- a b
- c d
- e f
- g h
- i j
- [root@creditease awk]# cat file2.txt
- 1 2
- 3 4
- 5 6
- 7 8
- 9 10
- [root@creditease awk]# awk 'NR==FNR{a[FNR]=$1}NR!=FNR{print a[FNR],$2}' file1.txt file2.txt
- a 2
- c 4
- e 6
- g 8
- i 10
- 解析:NR==FNR處理的是***個(gè)文件,NR!=FNR處理的是第二個(gè)文件.
- 注意:當(dāng)兩個(gè)文件NR(行數(shù))不同的時(shí)候,需要把行數(shù)多的放前邊.
- 解決方法:把行數(shù)多的文件放前邊,行數(shù)少的文件放后邊.
- 把輸出的結(jié)果放入一個(gè)新文件new.txt中:
- [root@creditease awk]# awk 'NR==FNR{a[FNR]=$1}NR!=FNR{print a[FNR],$2>"new.txt"}' file1.txt file2.txt
- [root@creditease awk]# cat new.txt
- a 2
- c 4
- e 6
- g 8
- i 10
1.7 awk分析日志文件,統(tǒng)計(jì)訪問網(wǎng)站的個(gè)數(shù)
- [root@creditease awk]# cat url.txt
- http://www.baidu.com
- http://mp4.video.cn
- http://www.qq.com
- http://www.listeneasy.com
- http://mp3.music.com
- http://www.qq.com
- http://www.qq.com
- http://www.listeneasy.com
- http://www.listeneasy.com
- http://mp4.video.cn
- http://mp3.music.com
- http://www.baidu.com
- http://www.baidu.com
- http://www.baidu.com
- http://www.baidu.com
- [root@creditease awk]# awk -F "[/]+" '{h[$2]++}END{for(i in h) print i,h[i]}' url.txt
- www.qq.com 3
- www.baidu.com 5
- mp4.video.cn 2
- mp3.music.com 2
- www.crediteasy.com 3
二、awk簡單語法
2.1 函數(shù)sub gsub
替換功能
格式:sub(r, s ,目標(biāo)) gsub(r, s ,目標(biāo))
- [root@creditease awk]# cat sub.txt
- ABC DEF AHI GKL$123
- BAC DEF AHI GKL$213
- CBA DEF GHI GKL$321
- [root@creditease awk]# awk '{sub(/A/,"a");print $0}' sub.txt
- aBC DEF AHI GKL$123
- BaC DEF AHI GKL$213
- CBa DEF GHI GKL$321
- [root@creditease awk]# awk '{gsub(/A/,"a");print $0}' sub.txt
- aBC DEF aHI GKL$123
- BaC DEF aHI GKL$213
- CBa DEF GHI GKL$321
- 注:sub只會替換行內(nèi)匹配的***次內(nèi)容;相當(dāng)于sed ‘s###’
- gsub 會替換行內(nèi)匹配的所有內(nèi)容;相當(dāng)于sed ‘s###g’
- [root@creditease awk]# awk '{sub(/A/,"a",$1);print $0}' sub.txt
- aBC DEF AHI GKL$123
- BaC DEF AHI GKL$213
- CBa DEF GHI GKL$321
練習(xí):
- 0001|20081223efskjfdj|EREADFASDLKJCV
- 0002|20081208djfksdaa|JDKFJALSDJFsddf
- 0003|20081208efskjfdj|EREADFASDLKJCV
- 0004|20081211djfksdaa1234|JDKFJALSDJFsddf
- 以'|'為分隔, 現(xiàn)要將第二個(gè)域字母前的數(shù)字去掉,其他地方都不變, 輸出為:
- 0001|efskjfdj|EREADFASDLKJCV
- 0002|djfksdaa|JDKFJALSDJFsddf
- 0003|efskjfdj|EREADFASDLKJCV
- 0004|djfksdaa1234|JDKFJALSDJFsddf
- 方法:
- awk -F '|' 'BEGIN{OFS="|"}{sub(/[0-9]+/,"",$2);print $0}' sub_hm.txt
- awk -F '|' -v OFS="|" '{sub(/[0-9]+/,"",$2);print $0}' sub_hm.txt
2.2 if和slse的用法
內(nèi)容:
AA
BC
AA
CB
CC
AA
結(jié)果:
AA YES
BC NO YES
AA YES
CB NO YES
CC NO YES
AA YES
- 1) [root@creditease awk]# awk '{if($0~/AA/){print $0" YES"}else{print $0" NO YES"}}' ifelse.txt
- AA YES
- BC NO YES
- AA YES
- CB NO YES
- CC NO YES
- AA YES
- 解析:使用if和else,if $0匹配到AA,則打印$0 "YES",else反之打印$0 " NO YES"。
- 2)[root@creditease awk]# awk '$0~/AA/{print $0" YES"}$0!~/AA/{print $0" NO YES"}' ifelse.txt
- AA YES
- BC NO YES
- AA YES
- CB NO YES
- CC NO YES
- AA YES
- 解析:使用正則匹配,當(dāng)$0匹配AA時(shí),打印出YES,反之,打印出“NO YES”
2.3 next用法
如上題,用next來實(shí)現(xiàn)
next :跳過它后邊的所有代碼
- [root@creditease awk]# awk '$0~/AA/{print $0" YES";next}{print $0" NO YES"}' ifelse.txt
- AA YES
- BC NO YES
- AA YES
- CB NO YES
- CC NO YES
- AA YES
- 解析:
- {print $0" NO YES"}:此動作是默認(rèn)執(zhí)行的,當(dāng)前邊的$0~/AA/匹配,就會執(zhí)行{print $0" YES";next}
- 因?yàn)閍ction中有next,所以會跳過后邊的action。
- 如果符合$0~/AA/則打印YES ,遇到next后,后邊的動作不執(zhí)行;如果不符合$0~/AA/,會執(zhí)行next后邊的動作;
- next前邊的(模式匹配),后邊的就不執(zhí)行,前邊的不執(zhí)行(模式不匹配),后邊的就執(zhí)行。
2.4 printf不換行輸出以及next用法
printf :打印后不換行
如下文本,如果 Description:之后為空,將其后一行內(nèi)容并入此行。
- Packages: Hello-1
- Owner: me me me me
- Other: who care?
- Description:
- Hello world!
- Other2: don't care
- 想要結(jié)果:
- Packages: Hello-1
- Owner: me me me me
- Other: who care?
- Description: Hello world!
- Origial-Owner: me me me me
- Other2: don't care
- 1)[root@creditease awk]# awk '/^Desc.*:$/{printf $0}!/Desc.*:$/{print $0}' printf.txt
- Packages: Hello-1
- Owner: me me me me
- Other: who care?
- Description:Hello world!
- Other2: don't care
- 解析:使用正則匹配,匹配到'/^Desc.*:$/,就使用printf打?。ú粨Q行),不匹配的打印出整行。
- 2)使用if和else實(shí)現(xiàn)
- [root@creditease awk]# awk '{if(/Des.*:$/){printf $0}else{print $0}}' printf.txt
- Packages: Hello-1
- Owner: me me me me
- Other: who care?
- Description:Hello world!
- Other2: don't care
- 3)使用next實(shí)現(xiàn)
- [root@creditease awk]# awk '/Desc.*:$/{printf $0;next}{print $0}' printf.txt
- Packages: Hello-1
- Owner: me me me me
- Other: who care?
- Description:Hello world!
- Other2: don't care
- 注:可簡寫成awk '/Desc.*:$/{printf $0;next}1'
- printf.txt ## 1是pattern(模式),默認(rèn)action(動作)是{print $0}
2.5 去重后計(jì)數(shù)按要求重定向到指定文件
文本如下,要求計(jì)算出每項(xiàng)重復(fù)的個(gè)數(shù),然后把重復(fù)次數(shù)大于2的放入gt2.txt文件中,把重復(fù)次數(shù)小于等于2的放入le2.txt文件中
- [root@creditease files]# cat qcjs.txt
- aaa
- bbb
- ccc
- aaa
- ddd
- bbb
- rrr
- ttt
- ccc
- eee
- ddd
- rrr
- bbb
- rrr
- bbb
- [root@creditease awk]# awk '{a[$1]++}END{for(i in a){if(a[i]>2){print i,a[i]>"gt2.txt"}else{print i,a[i]>"le2.txt"}}}' qcjs.txt
- [root@creditease awk]# cat gt2.txt
- rrr 3
- bbb 4
- [root@creditease awk]# cat le2.txt
- aaa 2
- ccc 2
- eee 1
- ttt 1
- ddd 2
- 解析:{print },或括號中打印后可直接重定向到一個(gè)新文件,文件名用雙引號引起來。如: {print $1 >"xin.txt"}
三、awk需注意事項(xiàng)
a)NR==FNR ##不能寫成NR=FNR(=在awk中是賦值的意思)
b)NR!=FNR ##NR不等于FNR
c){a=1;a[NR]} 這樣會報(bào)錯(cuò):同一條命令中變量和數(shù)組名不能重復(fù) d)printf 輸出的時(shí)候不換行
e){print },或括號中打印后可直接重定向到一個(gè)新文件,文件名用雙引號引起來。如: {print $1 >"xin.txt"}
f)當(dāng)模式(條件)是0的時(shí)候,后邊的動作不執(zhí)行,!0的時(shí)候后邊動作才執(zhí)行。
【本文是51CTO專欄機(jī)構(gòu)宜信技術(shù)學(xué)院的原創(chuàng)文章,微信公眾號“宜信技術(shù)學(xué)院( id: CE_TECH)”】