自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

搞定 Linux Shell 文本處理工具，看完這篇還不夠

作者：佚名 2021-09-10 16:30:29

系統(tǒng) Linux

本文將介紹Linux下使用Shell處理文本時最常用的工具：find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk；提供的例子和參數(shù)都是最常用和最為實用的。

本文將介紹Linux下使用Shell處理文本時最常用的工具：find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk；提供的例子和參數(shù)都是最常用和最為實用的；對shell腳本使用的原則是命令單行書寫，盡量不要超過2行；如果有更為復雜的任務需求，還是考慮python吧.

1、find 文件查找

查找txt和pdf文件

find . ( -name "*.txt" -o -name "*.pdf" ) -print

正則方式查找.txt和pdf

find . -regex  ".*(.txt|.pdf)$"  
#-iregex：忽略大小寫的正則

否定參數(shù):查找所有非txt文本

find . ! -name "*.txt" -print

指定搜索深度:打印出當前目錄的文件（深度為1）

find . -maxdepth 1 -type f

定制搜索

#按類型搜索：  
find . -type d -print  //只列出所有目錄  
#按時間搜索：  
-atime 訪問時間 (單位是天，分鐘單位則是-amin，以下類似）  
-mtime 修改時間 （內(nèi)容被修改）  
-ctime 變化時間 （元數(shù)據(jù)或權限變化）  
最近7天被訪問過的所有文件：  
find . -atime 7 -type f -print  
#按大小搜索：  
尋找大于2k的文件  
find . -type f -size +2k  
#按權限查找：  
find . -type f -perm 644 -print //找具有可執(zhí)行權限的所有文件  
#按用戶查找：  
find . -type f -user weber -print// 找用戶weber所擁有的文件

找到后的后續(xù)動作刪除：

#刪除當前目錄下所有的swp文件：  
find . -type f -name "*.swp" -delete  
#執(zhí)行動作（強大的exec）  
find . -type f -user root -exec chown weber {} ; //將當前目錄下的所有權變更為weber  
注：{}是一個特殊的字符串，對于每一個匹配的文件，{}會被替換成相應的文件名；  
eg：將找到的文件全都copy到另一個目錄：  
find . -type f -mtime +10 -name "*.txt" -exec cp {} OLD ;

結合多個命令tips: 如果需要后續(xù)執(zhí)行多個命令，可以將多個命令寫成一個腳本。然后 -exec 調(diào)用時執(zhí)行腳本即可；

-exec ./commands.sh {} ;  
#-print的定界符

默認使用' '作為文件的定界符；
-print0 使用''作為文件的定界符，這樣就可以搜索包含空格的文件；

2、grep 文本搜索

grep match_patten file // 默認訪問匹配行

常用參數(shù):

-o 只輸出匹配的文本行 VS -v 只輸出沒有匹配的文本行
-c 統(tǒng)計文件中包含文本的次數(shù)

grep -c "text" filename

n 打印匹配的行號
i 搜索時忽略大小寫
l 只打印文件名

在多級目錄中對文本遞歸搜索(程序員搜代碼的最愛）：

grep "class" . -R -n

匹配多個模式

grep -e "class" -e "vitural" file

grep輸出以作為結尾符的文件名：（-z）

grep "test" file* -lZ| xargs -0 rm

xargs 命令行參數(shù)轉換

xargs 能夠將輸入數(shù)據(jù)轉化為特定命令的命令行參數(shù)；這樣，可以配合很多命令來組合使用。比如grep，比如find；

將多行輸出轉化為單行輸出

cat file.txt| xargs

是多行文本間的定界符
將單行轉化為多行輸

cat single.txt | xargs -n 3  
#-n：指定每行顯示的字段數(shù)

xargs參數(shù)說明

-d 定義定界符（默認為空格多行的定界符為）
-n 指定輸出為多行
-I {} 指定替換字符串，這個字符串在xargs擴展時會被替換掉,用于待執(zhí)行的命令需要多個參數(shù)時

cat file.txt | xargs -I {} ./command.sh -p {} -1  
#-0：指定為輸入定界符  
#統(tǒng)計程序行數(shù)  
find source_dir/ -type f -name "*.cpp" -print0 |xargs -0 wc -l

3、sort 排序

字段說明：

-n 按數(shù)字進行排序 VS -d 按字典序進行排序
-r 逆序排序
-k N 指定按第N列排序

sort -nrk 1 data.txt  
sort -bd data // 忽略像空格之類的前導空白字符

4、uniq 消除重復行

消除重復行

sort unsort.txt | uniq

統(tǒng)計各行在文件中出現(xiàn)的次數(shù)

sort unsort.txt | uniq -c

找出重復行

sort unsort.txt | uniq -d

可指定每行中需要比較的重復內(nèi)容：-s 開始位置 -w 比較字符數(shù)

5、用 tr 進行轉換

通用用法

echo 12345| tr '0-9''9876543210' //加解密轉換，替換對應字符  
cat text| tr '    '' '  //制表符轉空格

tr刪除字符

cat file | tr -d '0-9'   // 刪除所有數(shù)字

-c 求補集

cat file | tr -c  '0-9'   //獲取文件中所有數(shù)字 
cat file | tr -d -c '0-9'  //刪除非數(shù)字數(shù)據(jù)

tr壓縮字符

tr -s 壓縮文本中出現(xiàn)的重復字符；最常用于壓縮多余的空格  
cat file | tr -s ' '

字符類：tr中可用各種字符類

alnum：字母和數(shù)字
alpha：字母
digit：數(shù)字
space：空白字符
lower：小寫
upper：大寫
cntrl：控制（非可打?。┳址?/li>
print：可打印字符

使用方法：tr [:class:] [:class:]  
eg: tr   
'[:lower:]''[:upper:]'

6、cut 按列切分文本

#截取文件的第2列和第4列：  
cut -f2,4 filename  
#去文件除第3列的所有列：  
cut -f3 --complement filename  
#-d 指定定界符：  
cat -f2 -d ";" filename

cut 取的范圍

N- 第N個字段到結尾
-M 第1個字段為M
N-M N到M個字段cut 取的單位
-b 以字節(jié)為單位
-c 以字符為單位
-f 以字段為單位（使用定界符

cut -c1-5 file //打印第一到5個字符  
cut -c-2 file  //打印前2個字符

7、paste 按列拼接文本

將兩個文本按列拼接到一起

cat file1  
1  
2 
cat file2 
colin  
book 
paste file1 file2 
1colin  
2 book

默認的定界符是制表符，可以用-d指明定界符

paste file1 file2 -d ","  
1,colin  
2,book

8、wc 統(tǒng)計行和字符的工具

wc -l file // 統(tǒng)計行數(shù)  
wc -w file // 統(tǒng)計單詞數(shù)  
wc -c file // 統(tǒng)計字符數(shù)

9、sed 文本替換利器

首處替換

seg 's/text/replace_text/'file   //替換每一行的第一處匹配的text

全局替換

seg 's/text/replace_text/g' file

默認替換后，輸出替換后的內(nèi)容，如果需要直接替換原文件,使用-i：

seg -i 's/text/repalce_text/g' file

移除空白行：

sed '/^$/d' file

變量轉換

已匹配的字符串通過標記&來引用.

echo this is en example | seg 's/w+/[&]/g'  
$>[this]  [is] [en] [example]

子串匹配標記

第一個匹配的括號內(nèi)容使用標記來引用

sed 's/hello([0-9])//'

雙引號求值

sed通常用單引號來引用；也可使用雙引號，使用雙引號后，雙引號會對表達式求值：
sed 's/$var/HLLOE/'當使用雙引號時，我們可以在sed樣式和替換字符串中指定變量；

p=patten  
r=replaced  
echo "line con a patten"| sed "s/$p/$r/g"  
$>line con a replaced

字符串插入字符：將文本中每行內(nèi)容（PEKSHA）轉換為 PEK/SHA

sed 's/^.{3}/&//g' file

10、awk 數(shù)據(jù)流處理工具

awk腳本結構

awk ' BEGIN{ statements } statements2 END{ statements } '

工作方式

1.執(zhí)行begin中語句塊；
2.從文件或stdin中讀入一行，然后執(zhí)行statements2，重復這個過程，直到文件全部被讀取完畢；
3.執(zhí)行end語句塊

print 打印當前行,使用不帶參數(shù)的print時，會打印當前行;

echo -e "line1 line2"| awk 'BEGIN{print "start"} {print } END{ print "End" }'  
#print 以逗號分割時，參數(shù)以空格定界;  
echo | awk ' {var1 = "v1" ; var2 = "V2"; var3="v3";  
print var1, var2 , var3; }'  
$>v1 V2 v3  
#使用-拼接符的方式（""作為拼接符）;  
echo | awk ' {var1 = "v1" ; var2 = "V2"; var3="v3";  
print var1"-"var2"-"var3; }'  
$>v1-V2-v3

特殊變量：NR NF 01 $2

NR:表示記錄數(shù)量，在執(zhí)行過程中對應當前行號；
NF:表示字段數(shù)量，在執(zhí)行過程總對應當前行的字段數(shù)；
$0:這個變量包含執(zhí)行過程中當前行的文本內(nèi)容；
$1:第一個字段的文本內(nèi)容；
$2:第二個字段的文本內(nèi)容

echo -e "line1 f2 f3 line2 line 3"| awk '{print NR":"$0"-"$1"-"$2}'   
#打印每一行的第二和第三個字段  
awk '{print $2, $3}' file   
#統(tǒng)計文件的行數(shù)：  
awk ' END {print NR}' file  
#累加每一行的第一個字段：  
echo -e "1 2 3 4 "| awk 'BEGIN{num = 0 ;print "begin";} {sum += $1;}END {print "=="; print sum }'     
#傳遞外部變量  
var=1000  
echo | awk '{print vara}' vara=$var #輸入來自stdin  
awk '{print vara}' vara=$var file # 輸入來自文件

用樣式對awk處理的行進行過濾

awk 'NR < 5' #行號小于5  
awk 'NR==1,NR==4 {print}' file #行號等于1和4的打印出來  
awk '/linux/'  #包含linux文本的行（可以用正則表達式來指定，超級強大）  
awk '!/linux/'  #不包含linux文本的行

設置定界符

使用-F來設置定界符（默認為空格）

awk -F: '{print $NF}'/etc/passwd

讀取命令輸出

使用getline，將外部shell命令的輸出讀入到變量cmdout中；

echo | awk '{"grep root /etc/passwd" | getline cmdout; print cmdout }'

在awk中使用循環(huán)

for (i=0;i<10;i++){print $i;}  
for (i in array){print array[i];}

以逆序的形式打印行：(tac命令的實現(xiàn)）

seq 9|awk '{lifo[NR] = $0; lno=NR}END{ for(;lno>-1;lno--){print lifo[lno];}} '

awk實現(xiàn)head、tail命令

head:  
 awk 'NR<=10{print}' filename  
tail:  
  awk '{buffer[NR%10] = $0;} END{for(i=0;i<11;i++){  
  print buffer[i %10]} } ' filename

打印指定列

#awk方式實現(xiàn)：  
ls -lrt | awk   
'{print $6}'  
#cut方式實現(xiàn)  
ls -lrt | cut -f6

打印指定文本區(qū)域

#確定行號  
seq 100| awk 'NR==4,NR==6{print}'  
#確定文本  
打印處于startpattern 和endpattern之間的文本；  
awk '/start_pattern/, /end_pattern/' filename  
seq 100| awk '/13/,/15/'  
cat /etc/passwd| awk '/mai.*mail/,/news.*news/'

awk常用內(nèi)建函數(shù)

index(string,search_string):返回search_string在string中出現(xiàn)的位置sub(regex,replacement_str,string):將正則匹配到的第一處內(nèi)容替換為replacement_str;
match(regex,string):檢查正則表達式是否能夠匹配字符串；
length(string)：返回字符串長度

echo | awk '{"grep root /etc/passwd" | getline cmdout; print length(cmdout) }'  
#printf 類似c語言中的printf，對輸出進行格式化  
seq 10| awk '{printf "->%4s ", $1}'  #迭代文件中的行、單詞和字符

1. 迭代文件中的每一行

while 循環(huán)法  
while read line;  
do  
echo $line;  
done < file.txt

改成子shell:

cat file.txt | (  
while read line;  
do  
 echo $line;  
done  
)

awk法：

cat file.txt| awk '{print}'

2. 迭代一行中的每一個單詞

for word in $line;  
do  
echo $word;  
done

3. 迭代每一個字符{#word}:返回變量word的長度

for ((i=0;i<${#word};i++))  
do  
echo ${word:i:1);  
done

責任編輯：龐桂玉來源： Linux學習

Linux Shell 文本

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<output id="7bh4n"></output>

<acronym id="7bh4n"><var id="7bh4n"></var></acronym><menuitem id="7bh4n"></menuitem>

<big id="7bh4n"><progress id="7bh4n"></progress></big>