如何用Linux命令行工具解析和格式化輸出JSON
JSON 是一種輕量級(jí)且與語言無關(guān)的數(shù)據(jù)存儲(chǔ)格式,易于與大多數(shù)編程語言集成,也易于人類理解 —— 當(dāng)然,如果格式正確的話。JSON 這個(gè)詞代表 Java Script Object Notation,雖然它以 JavaScript 開頭,而且主要用于在服務(wù)器和瀏覽器之間交換數(shù)據(jù),但現(xiàn)在正在用于許多領(lǐng)域,包括嵌入式系統(tǒng)。在這里,我們將使用 Linux 上的命令行工具解析并格式化打印 JSON。它對(duì)于在 shell 腳本中處理大型 JSON 數(shù)據(jù)或在 shell 腳本中處理 JSON 數(shù)據(jù)非常有用。
什么是格式化輸出?
JSON 數(shù)據(jù)的結(jié)構(gòu)更具人性化。但是在大多數(shù)情況下,JSON 數(shù)據(jù)會(huì)存儲(chǔ)在一行中,甚至沒有行結(jié)束字符。
顯然,這對(duì)于手動(dòng)閱讀和編輯不太方便。
這是格式化輸出就很有用。這個(gè)該名稱不言自明:重新格式化 JSON 文本,使人們讀起來更清晰。這被稱為 JSON 格式化輸出。
用 Linux 命令行工具解析和格式化輸出 JSON
可以使用命令行文本處理器解析 JSON 數(shù)據(jù),例如 awk
、sed
和 gerp
。實(shí)際上 JSON.awk
是一個(gè)來做這個(gè)的 awk 腳本。但是,也有一些專用工具可用于同一目的。
jq
或jshon
,shell 下的 JSON 解析器,它們都非常有用。- Shell 腳本,如
JSON.sh
或jsonv.sh
,用于在 bash、zsh 或 dash shell 中解析JSON。 JSON.awk
,JSON 解析器 awk 腳本。- 像
json.tool
這樣的 Python 模塊。 undercore-cli
,基于 Node.js 和 javascript。
在本教程中,我只關(guān)注 jq
,這是一個(gè) shell 下的非常強(qiáng)大的 JSON 解析器,具有高級(jí)過濾和腳本編程功能。
JSON 格式化輸出
JSON 數(shù)據(jù)可能放在一行上使人難以解讀,因此為了使其具有一定的可讀性,JSON 格式化輸出就可用于此目的的。
示例:來自 jsonip.com
的數(shù)據(jù),使用 curl
或 wget
工具獲得 JSON 格式的外部 IP 地址,如下所示。
$ wget -cq http://jsonip.com/ -O -
實(shí)際數(shù)據(jù)看起來類似這樣:
{"ip":"111.222.333.444","about":"/about","Pro!":"http://getjsonip.com"}
現(xiàn)在使用 jq
格式化輸出它:
$ wget -cq http://jsonip.com/ -O - | jq '.'
通過 jq
過濾了該結(jié)果之后,它應(yīng)該看起來類似這樣:
{
"ip": "111.222.333.444",
"about": "/about",
"Pro!": "http://getjsonip.com"
}
同樣也可以通過 Python json.tool
模塊做到。示例如下:
$ cat anything.json | python -m json.tool
這種基于 Python 的解決方案對(duì)于大多數(shù)用戶來說應(yīng)該沒問題,但是如果沒有預(yù)安裝或無法安裝 Python 則不行,比如在嵌入式系統(tǒng)上。
然而,json.tool
Python 模塊具有明顯的優(yōu)勢(shì),它是跨平臺(tái)的。因此,你可以在 Windows、Linux 或 Mac OS 上無縫使用它。
如何用 jq 解析 JSON
首先,你需要安裝 jq
,它已被大多數(shù) GNU/Linux 發(fā)行版選中,并使用各自的軟件包安裝程序命令進(jìn)行安裝。
在 Arch Linux 上:
$ sudo pacman -S jq
在 Debian、Ubuntu、Linux Mint 上:
$ sudo apt-get install jq
在 Fedora 上:
$ sudo dnf install jq
在 openSUSE 上:
$ sudo zypper install jq
對(duì)于其它操作系統(tǒng)或平臺(tái)參見官方的安裝指導(dǎo)。
jq 的基本過濾和標(biāo)識(shí)符功能
jq
可以從 STDIN
或文件中讀取 JSON 數(shù)據(jù)。你可以根據(jù)情況使用。
單個(gè)符號(hào) .
是最基本的過濾器。這些過濾器也稱為對(duì)象標(biāo)識(shí)符-索引。jq
使用單個(gè) .
過濾器基本上相當(dāng)將輸入的 JSON 文件格式化輸出。
- 單引號(hào):不必始終使用單引號(hào)。但是如果你在一行中組合幾個(gè)過濾器,那么你必須使用它們。
- 雙引號(hào):你必須用兩個(gè)雙引號(hào)括起任何特殊字符,如
@
、#
、$
,例如jq .foo.”@bar”
。 - 原始數(shù)據(jù)打印:不管出于任何原因,如果你只需要最終解析的數(shù)據(jù)(不包含在雙引號(hào)內(nèi)),請(qǐng)使用帶有
-r
標(biāo)志的jq
命令,如下所示:jq -r .foo.bar
。
解析特定數(shù)據(jù)
要過濾出 JSON 的特定部分,你需要了解格式化輸出的 JSON 文件的數(shù)據(jù)層次結(jié)構(gòu)。
來自維基百科的 JSON 數(shù)據(jù)示例:
{
"firstName": "John",
"lastName": "Smith",
"age": 25,
"address": {
"streetAddress": "21 2nd Street",
"city": "New York",
"state": "NY",
"postalCode": "10021"
},
"phoneNumber": [
{
"type": "home",
"number": "212 555-1234"
},
{
"type": "fax",
"number": "646 555-4567"
}
],
"gender": {
"type": "male"
}
}
我將在本教程中將此 JSON 數(shù)據(jù)用作示例,將其保存為 sample.json
。
假設(shè)我想從 sample.json
文件中過濾出地址。所以命令應(yīng)該是這樣的:
$ jq .address sample.json
示例輸出:
{
"streetAddress": "21 2nd Street",
"city": "New York",
"state": "NY",
"postalCode": "10021"
}
再次,我想要郵政編碼,然后我要添加另一個(gè)對(duì)象標(biāo)識(shí)符-索引,即另一個(gè)過濾器。
$ cat sample.json | jq .address.postalCode
另請(qǐng)注意,過濾器區(qū)分大小寫,并且你必須使用完全相同的字符串來獲取有意義的輸出,否則就是 null。
從 JSON 數(shù)組中解析元素
JSON 數(shù)組的元素包含在方括號(hào)內(nèi),這無疑是非常通用的。
要解析數(shù)組中的元素,你必須使用 []
標(biāo)識(shí)符以及其他對(duì)象標(biāo)識(shí)符索引。
在此示例 JSON 數(shù)據(jù)中,電話號(hào)碼存儲(chǔ)在數(shù)組中,要從此數(shù)組中獲取所有內(nèi)容,你只需使用括號(hào),像這個(gè)示例:
$ jq .phoneNumber[] sample.json
假設(shè)你只想要數(shù)組的第一個(gè)元素,然后使用從 0
開始的數(shù)組對(duì)象編號(hào),對(duì)于第一個(gè)項(xiàng)目,使用 [0]
,對(duì)于下一個(gè)項(xiàng)目,它應(yīng)該每步增加 1。
$ jq .phoneNumber[0] sample.json
腳本編程示例
假設(shè)我只想要家庭電話,而不是整個(gè) JSON 數(shù)組數(shù)據(jù)。這就是用 jq
命令腳本編寫的方便之處。
$ cat sample.json | jq -r '.phoneNumber[] | select(.type == "home") | .number'
首先,我將一個(gè)過濾器的結(jié)果傳遞給另一個(gè),然后使用 select
屬性選擇特定類型的數(shù)據(jù),再次將結(jié)果傳遞給另一個(gè)過濾器。
解釋每種類型的 jq
過濾器和腳本編程超出了本教程的范圍和目的。強(qiáng)烈建議你閱讀 jq
手冊(cè),以便更好地理解下面的內(nèi)容。
資源:
- https://stedolan.github.io/jq/manual/
- http://www.compciv.org/recipes/cli/jq-for-parsing-json/
- https://lzone.de/cheat-sheet/jq
【編輯推薦】