自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

合并和排序Linux上的文件

系統(tǒng) Linux
在 Linux 上合并和排序文本的方法有很多種,但如何去處理它取決于你試圖做什么:你是只想將多個(gè)文件的內(nèi)容放入一個(gè)文件中,還是以某種方式組織它,讓它更易于使用。在本文中,我們將查看一些用于排序和合并文件內(nèi)容的命令,并重點(diǎn)介紹結(jié)果有何不同。

[[339136]]

在 Linux 上合并和排序文本的方法有很多種,但如何去處理它取決于你試圖做什么:你是只想將多個(gè)文件的內(nèi)容放入一個(gè)文件中,還是以某種方式組織它,讓它更易于使用。在本文中,我們將查看一些用于排序和合并文件內(nèi)容的命令,并重點(diǎn)介紹結(jié)果有何不同。

使用 cat

如果你只想將一組文件放到單個(gè)文件中,那么 cat 命令是一個(gè)容易的選擇。你所要做的就是輸入 cat,然后按你希望它們?cè)诤喜⑽募械捻樞蛟诿钚兄辛谐鲞@些文件。將命令的輸出重定向到要?jiǎng)?chuàng)建的文件。如果指定名稱的文件已經(jīng)存在,那么文件將被覆蓋。例如:

  1. $ cat firstfile secondfile thirdfile > newfile

如果要將一系列文件的內(nèi)容添加到現(xiàn)有文件中,而不是覆蓋它,只需將 > 變成 >>。

  1. $ cat firstfile secondfile thirdfile >> updated_file

如果你要合并的文件遵循一些方便的命名約定,那么任務(wù)可能更簡(jiǎn)單。如果可以使用正則表達(dá)式指定所有文件名,那就不必列出所有文件。例如,如果文件全部以 file 結(jié)束,如上所示,你可以進(jìn)行如下操作:

  1. $ cat *file > allfiles

請(qǐng)注意,上面的命令將按字母數(shù)字順序添加文件內(nèi)容。在 Linux 上,一個(gè)名為 filea 的文件將排在名為 fileA 的文件的前面,但會(huì)在 file7 的后面。畢竟,當(dāng)我們處理字母數(shù)字序列時(shí),我們不僅需要考慮 ABCDE,還需要考慮 0123456789aAbBcCdDeE。你可以使用 ls *file 這樣的命令來(lái)查看合并文件之前文件的順序。

注意:首先確保你的命令包含合并文件中所需的所有文件,而不是其他文件,尤其是你使用 * 等通配符時(shí)。不要忘記,用于合并的文件仍將單獨(dú)存在,在確認(rèn)合并后,你可能想要?jiǎng)h除這些文件。

按時(shí)間期限合并文件

如果要基于每個(gè)文件的時(shí)間期限而不是文件名來(lái)合并文件,請(qǐng)使用以下命令:

  1. $ for file in `ls -tr myfile.*`; do cat $file >> BigFile.$$; done

使用 -tr 選項(xiàng)(t = 時(shí)間,r = 反向)將產(chǎn)生按照最早的在最前排列的文件列表。例如,如果你要保留某些活動(dòng)的日志,并且希望按活動(dòng)執(zhí)行的順序添加內(nèi)容,則這非常有用。

上面命令中的 $$ 表示運(yùn)行命令時(shí)的進(jìn)程 ID。不是很必要使用此功能,但它幾乎不可能會(huì)無(wú)意添加到現(xiàn)有的文件,而不是創(chuàng)建新文件。如果使用 $$,那么生成的文件可能如下所示:

  1. $ ls -l BigFile.*
  2. -rw-rw-r-- 1 justme justme 931725 Aug 6 12:36 BigFile.582914

合并和排序文件

Linux 提供了一些有趣的方式來(lái)對(duì)合并之前或之后的文件內(nèi)容進(jìn)行排序。

按字母對(duì)內(nèi)容進(jìn)行排序

如果要對(duì)合并的文件內(nèi)容進(jìn)行排序,那么可以使用以下命令對(duì)整體內(nèi)容進(jìn)行排序:

  1. $ cat myfile.1 myfile.2 myfile.3 | sort > newfile

如果要按文件對(duì)內(nèi)容進(jìn)行分組,請(qǐng)使用以下命令對(duì)每個(gè)文件進(jìn)行排序,然后再將它添加到新文件中:

  1. $ for file in `ls myfile.?`; do sort $file >> newfile; done

對(duì)文件進(jìn)行數(shù)字排序

要對(duì)文件內(nèi)容進(jìn)行數(shù)字排序,請(qǐng)?jiān)?nbsp;sort 中使用 -n 選項(xiàng)。僅當(dāng)文件中的行以數(shù)字開頭時(shí),此選項(xiàng)才有用。請(qǐng)記住,按照默認(rèn)順序,02 將小于 1。當(dāng)你要確保行以數(shù)字排序時(shí),請(qǐng)使用 -n 選項(xiàng)。

  1. $ cat myfile.1 myfile.2 myfile.3 | sort -n > xyz

如果文件中的行以 2020-11-03 或 2020/11/03(年月日格式)這樣的日期格式開頭,-n 選項(xiàng)還能讓你按日期對(duì)內(nèi)容進(jìn)行排序。其他格式的日期排序?qū)⒎浅<郑⑶覍⑿枰鼜?fù)雜的命令。

使用 paste

paste 命令允許你逐行連接文件內(nèi)容。使用此命令時(shí),合并文件的第一行將包含要合并的每個(gè)文件的第一行。以下是示例,其中我使用了大寫字母以便于查看行的來(lái)源:

  1. $ cat file.a
  2. A one
  3. A two
  4. A three
  5.  
  6. $ paste file.a file.b file.c
  7. A one B one C one
  8. A two B two C two
  9. A three B three C thee
  10. B four C four
  11. C five

將輸出重定向到另一個(gè)文件來(lái)保存它:

  1. $ paste file.a file.b file.c > merged_content

或者,你可以將每個(gè)文件的內(nèi)容在同一行中合并,然后將文件粘貼在一起。這需要使用 -s(序列)選項(xiàng)。注意這次的輸出如何顯示每個(gè)文件的內(nèi)容:

  1. $ paste -s file.a file.b file.c
  2. A one A two A three
  3. B one B two B three B four
  4. C one C two C thee C four C five

使用 join

合并文件的另一個(gè)命令是 join。join 命令讓你能基于一個(gè)共同字段合并多個(gè)文件的內(nèi)容。例如,你可能有一個(gè)包含一組同事的電話的文件,其中,而另一個(gè)包含了同事的電子郵件地址,并且兩者均按個(gè)人姓名列出。你可以使用 join 創(chuàng)建一個(gè)包含電話和電子郵件地址的文件。

一個(gè)重要的限制是文件的行必須是相同的順序,并在每個(gè)文件中包括用于連接的字段。

這是一個(gè)示例命令:

  1. $ join phone_numbers email_addresses
  2. Sandra 555-456-1234 bugfarm@gmail.com
  3. Pedro 555-540-5405
  4. John 555-333-1234 john_doe@gmail.com
  5. Nemo 555-123-4567 cutie@fish.com

在本例中,即使缺少附加信息,第一個(gè)字段(名字)也必須存在于每個(gè)文件中,否則命令會(huì)因錯(cuò)誤而失敗。對(duì)內(nèi)容進(jìn)行排序有幫助,而且可能更容易管理,但只要順序一致,就不需要這么做。

總結(jié)

在 Linux 上,你有很多可以合并和排序存儲(chǔ)在單獨(dú)文件中的數(shù)據(jù)的方式。這些方法可以使原本繁瑣的任務(wù)變得異常簡(jiǎn)單。 

責(zé)任編輯:龐桂玉 來(lái)源: Linux中國(guó)
相關(guān)推薦

2020-08-23 09:16:46

Linux文件合并和排序

2011-05-25 16:44:01

JavaScriptCSS

2020-08-29 19:17:19

Linux文件列表排序

2024-09-10 09:03:54

微軟TypeScript

2020-06-15 08:12:07

Linux系統(tǒng)數(shù)據(jù)

2023-04-17 16:17:19

LinuxPDF

2018-01-31 12:40:48

Linux命令文件搜索

2022-08-14 19:27:16

LinuxmacOS

2019-04-25 13:30:14

Linux文件分身

2020-07-13 07:30:12

Linux提取文件腳本

2021-11-26 22:01:26

Linux傳輸網(wǎng)絡(luò)

2011-04-14 17:03:50

Linuxsplitcat

2019-10-11 08:00:00

Linux命令最大文件

2023-02-07 09:49:26

Linux命令行合并文件

2011-03-07 09:11:23

2020-03-24 08:00:00

Linux日志文件

2019-06-10 08:15:52

Linux命令

2020-10-05 22:02:00

testdiskLinux文件

2013-02-21 17:02:00

C語(yǔ)言

2021-06-10 09:05:43

Linux命令大文件切割
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)