Dill:Python中增強(qiáng)版的pickle
大家好我是費(fèi)老師,相信不少讀者朋友們都在Python?中利用pickle?進(jìn)行過序列化操作,而所謂的序列化,指的是將程序運(yùn)行時(shí)在內(nèi)存中產(chǎn)生的變量對(duì)象,轉(zhuǎn)換為二進(jìn)制類型的易存儲(chǔ)可傳輸數(shù)據(jù)的過程,相反地,從序列化結(jié)果解析還原為Python變量就叫做反序列化。
通常我們都是用標(biāo)準(zhǔn)庫(kù)pickle?進(jìn)行這項(xiàng)操作,但其功能單一,且針對(duì)很多常見的Python?對(duì)象如lambda?函數(shù)無法進(jìn)行序列化。而今天費(fèi)老師我要給大家介紹的庫(kù)dill?就可以看作增強(qiáng)版的pickle。
使用dill實(shí)現(xiàn)更豐富的序列化/反序列化操作
作為第三方庫(kù),我們使用pip install dill?完成安裝后,就可以使用它來代替pickle了:
基礎(chǔ)使用
dill?的基礎(chǔ)使用與pickle?一樣,使用dump/dumps?進(jìn)行序列化操作,load/loads進(jìn)行反序列化操作,下面是一些基本的例子,我們對(duì)一些常見的對(duì)象進(jìn)行序列化/反序列化操作:
import dill
import numpy as np
demo_int = 999
demo_float = 0.99
demo_dict = {'a': 999}
demo_array = np.random.rand(2, 2)
# 序列化并寫出到pkl文件
with open('./demo.pkl', 'wb') as d:
dill.dump(
[demo_int, demo_float, demo_dict, demo_array],
d
)
從寫出的demo.pkl文件中還原對(duì)象:
# 序列化并寫出到pkl文件
with open('./demo.pkl', 'rb') as d:
restore_demo = dill.load(d)
restore_demo
增強(qiáng)功能
看完了dill?的基礎(chǔ)用法,下面我們來介紹其相對(duì)于pickle進(jìn)行增強(qiáng)的特殊功能:
對(duì)lambda函數(shù)進(jìn)行序列化
pickle?可以對(duì)常規(guī)的函數(shù)進(jìn)行序列化,但針對(duì)lambda?函數(shù)則會(huì)報(bào)錯(cuò),而使用dill就可以正常序列化:
保存解釋器的會(huì)話狀態(tài)
dill?中另一項(xiàng)很實(shí)用的功能則是其支持將當(dāng)前解釋器的會(huì)話狀態(tài)整個(gè)打包保存和還原,譬如下面的例子,利用dill.dump_session()?保存當(dāng)前解釋器會(huì)話狀態(tài),在另一個(gè)獨(dú)立的py?腳本中再利用dill.load_session()就可以一步到位全部還原:
從序列化結(jié)果中還原源碼
dill?中另一個(gè)很強(qiáng)大的功能是其source?模塊可以從序列化結(jié)果中還原對(duì)象的源碼,這在序列化的對(duì)象為函數(shù)時(shí)非常實(shí)用(注意目前此功能不可以在ipykernel?中執(zhí)行,因此下面的例子使用魔術(shù)命令直接執(zhí)行外部py腳本):
除此之外,dill?還有很多其他豐富的功能,感興趣的讀者朋友可以前往其官方文檔(https://dill.readthedocs.io/en/latest/dill.html)了解更多。