使用Python處理JSON格式的數(shù)據(jù)
如果你不希望從頭開始創(chuàng)造一種數(shù)據(jù)格式來存放數(shù)據(jù),JSON 是一個(gè)很好的選擇。如果你對(duì) Python 有所了解,就更加事半功倍了。下面就來介紹一下如何使用 Python 處理 JSON 數(shù)據(jù)。
JSON 的全稱是 JavaScript 對(duì)象表示法。這是一種以鍵值對(duì)的形式存儲(chǔ)數(shù)據(jù)的格式,并且很容易解析,因而成為了一種被廣泛使用的數(shù)據(jù)格式。另外,不要因?yàn)? JSON 名稱而望文生義,JSON 并不僅僅在 JavaScript 中使用,它也可以在其它語言中使用。下文會(huì)介紹它是如何在 Python 中使用的。
首先我們給出一個(gè) JSON 示例:
{
"name":"tux",
"health":"23",
"level":"4"
}
上面是一個(gè)和編程語言無關(guān)的原生 JSON 數(shù)據(jù)。熟悉 Python 的人會(huì)看出來這個(gè) JSON 數(shù)據(jù)跟 Python 中的字典長得很像。而這兩者之間確實(shí)非常相似,如果你對(duì) Python 中的列表和字典數(shù)據(jù)結(jié)構(gòu)有一定的理解,那么 JSON 理解起來也不難。
使用字典存放數(shù)據(jù)
如果你的應(yīng)用需要存儲(chǔ)一些結(jié)構(gòu)復(fù)雜的數(shù)據(jù),不妨考慮使用 JSON 格式。對(duì)比你可能曾經(jīng)用過的自定義格式的文本配置文件,JSON 提供了更加結(jié)構(gòu)化的可遞歸的存儲(chǔ)格式。同時(shí),Python 自帶的 json
模塊已經(jīng)提供了可以將 JSON 數(shù)據(jù)導(dǎo)入/導(dǎo)出應(yīng)用時(shí)所需的所有解析庫。因此,你不需要針對(duì) JSON 自行編寫代碼進(jìn)行解析,而其他開發(fā)人員在與你的應(yīng)用進(jìn)行數(shù)據(jù)交互的時(shí)候也不需要去解析新的數(shù)據(jù)格式。正是這個(gè)原因,JSON 在數(shù)據(jù)交換時(shí)被廣泛地采用了。
以下是一段在 Python 中使用嵌套字典的代碼:
#!/usr/bin/env python3
import json
# instantiate an empty dict
team = {}
# add a team member
team['tux'] = {'health': 23, 'level': 4}
team['beastie'] = {'health': 13, 'level': 6}
team['konqi'] = {'health': 18, 'level': 7}
這段代碼聲明了一個(gè)名為 team
的字典,并初始化為一個(gè)空字典。
如果要給這個(gè)字典添加內(nèi)容,首先需要?jiǎng)?chuàng)建一個(gè)鍵,例如上面示例中的 tux
、beastie
、konqi
,然后為這些鍵一一提供對(duì)應(yīng)的值。上面示例中的值由一個(gè)個(gè)包含游戲玩家信息的字典充當(dāng)。
字典是一種可變的變量。字典中的數(shù)據(jù)可以隨時(shí)添加、刪除或更新。這樣的特性使得字典成為了應(yīng)用程序存儲(chǔ)數(shù)據(jù)的極好選擇。
使用 JSON 格式存儲(chǔ)數(shù)據(jù)
如果存放在字典中的數(shù)據(jù)需要持久存儲(chǔ),這些數(shù)據(jù)就需要寫到文件當(dāng)中。這個(gè)時(shí)候就需要用到 Python 中的 json
模塊了:
with open('mydata.json', 'w') as f:
json.dump(team, f)
上面的代碼首先創(chuàng)建了一個(gè)名為 mydata.json
的文件,然后以寫模式打開了這個(gè)文件,這個(gè)被打開的文件以變量 f
表示(當(dāng)然也可以用任何你喜歡的名稱,例如 file
、output
等)。而 json
模塊中的 dump()
方法則是用于將一個(gè)字典輸出到一個(gè)文件中。
從應(yīng)用中導(dǎo)出數(shù)據(jù)就是這么簡單,同時(shí)這些導(dǎo)出的數(shù)據(jù)是結(jié)構(gòu)化的、可理解的?,F(xiàn)在可以查看導(dǎo)出的數(shù)據(jù):
$ cat mydata.json
{"tux": {"health": 23, "level": 4}, "beastie": {"health": 13, "level": 6}, "konqi": {"health": 18, "level": 7}}
從 JSON 文件中讀取數(shù)據(jù)
如果已經(jīng)將數(shù)據(jù)以 JSON 格式導(dǎo)出到文件中了,也有可能需要將這些數(shù)據(jù)讀回到應(yīng)用中去。這個(gè)時(shí)候,可以使用 Python json
模塊中的 load()
方法:
#!/usr/bin/env python3
import json
f = open('mydata.json')
team = json.load(f)
print(team['tux'])
print(team['tux']['health'])
print(team['tux']['level'])
print(team['beastie'])
print(team['beastie']['health'])
print(team['beastie']['level'])
# when finished, close the file
f.close()
這個(gè)方法實(shí)現(xiàn)了和保存文件大致相反的操作。使用一個(gè)變量 f
來表示打開了的文件,然后使用 json
模塊中的 load()
方法讀取文件中的數(shù)據(jù)并存放到 team
變量中。
其中的 print()
展示了如何查看讀取到的數(shù)據(jù)。在過于復(fù)雜的字典中迭代調(diào)用字典鍵的時(shí)候有可能會(huì)稍微轉(zhuǎn)不過彎來,但只要熟悉整個(gè)數(shù)據(jù)的結(jié)構(gòu),就可以慢慢摸索出其中的邏輯。
當(dāng)然,這里使用 print()
的方式太不靈活了。你可以將其改寫成使用 for
循環(huán)的形式:
for i in team.values():
print(i)
使用 JSON
如上所述,在 Python 中可以很輕松地處理 JSON 數(shù)據(jù)。因此只要你的數(shù)據(jù)符合 JSON 的模式,就可以選擇使用 JSON。JSON 非常靈活易用,下次使用 Python 的時(shí)候不妨嘗試一下。