你的想象力限制了 Python 能力,自動(dòng)化識(shí)別函數(shù)調(diào)用關(guān)系,還能可視化
前言
我喜歡用 python 做一些臨時(shí)性數(shù)據(jù)工作,簡(jiǎn)單情況下,直接一把梭寫(xiě)到底。比如簡(jiǎn)單的多文件合并數(shù)據(jù):
定義函數(shù)?一輩子都不可能。
不過(guò),稍微復(fù)雜一些的情況,比如下面是 tableau prep 數(shù)據(jù)任務(wù)挑戰(zhàn)中一道簡(jiǎn)單題目——尋找可能具有欺詐性的交易。
代碼畫(huà)風(fēng)突變成這樣子:
不讓我定義函數(shù)?想要我命了吧!
得益于 pandas 的管道功能,我們可以更容易管理復(fù)雜的數(shù)據(jù)任務(wù)代碼。關(guān)于如何以正確的思路使用 pandas 管道(pipe) ,具體可以查看我的 pandas 專(zhuān)欄。
數(shù)據(jù)處理是一種"重流程"的編程。但是,你會(huì)發(fā)現(xiàn),上面的代碼不管如何劃分,你也無(wú)法容易理清楚數(shù)據(jù)流程。這才是痛點(diǎn)。
那如果有一種工具,可以把函數(shù)調(diào)用關(guān)系,以可視化方式展示給你,并且你可以輕松查看每一步處理結(jié)果的數(shù)據(jù),還能直接跳轉(zhuǎn)到具體代碼行?看看演示:
- 自動(dòng)生成函數(shù)調(diào)用圖。流程圖可以縮放,拖動(dòng)平移
- 點(diǎn)擊每個(gè)節(jié)點(diǎn),下方出現(xiàn)函數(shù)處理結(jié)果的表數(shù)據(jù)。還可以通過(guò)勾選,快速篩選數(shù)據(jù)
當(dāng)然,如果不能快速定位到代碼,那就沒(méi)有意思。
工具使用 nicegui 制作。
pandas 專(zhuān)欄馬上開(kāi)始最后關(guān)于工程化的階段,本節(jié)介紹的可視化工具就是為了專(zhuān)欄而制作。工程化的章節(jié)內(nèi)容,將會(huì)是大量 tableau prep 數(shù)據(jù)處理挑戰(zhàn)任務(wù)實(shí)戰(zhàn)。
要做到這樣的可視化,必需找到一種方式,可以在 python 中,自動(dòng)化識(shí)別函數(shù)調(diào)用關(guān)系。
今天,我們探討一下,如何做到這一切。重點(diǎn)是分享里面涉及到的 python 知識(shí)。
目前我想到3種實(shí)現(xiàn)方式,本文講解其中一種。
驗(yàn)證想法
要設(shè)計(jì)一個(gè)新的功能,我們需要從最簡(jiǎn)單的問(wèn)題開(kāi)始,驗(yàn)證想法是否能行。假設(shè)兩個(gè)簡(jiǎn)單的函數(shù)
- 在函數(shù) b 中,調(diào)用了 函數(shù) a
現(xiàn)在我們需要的是,得到一個(gè)記錄信息,能反映出,函數(shù) b 中,使用了函數(shù) a。
python 中可以做到嗎?
這涉及 python 中一個(gè)概念——閉包。直觀來(lái)說(shuō),閉包就是一個(gè)函數(shù)中,直接使用了外部定義的變量。就像上面例子中,函數(shù) b 中并沒(méi)有定義變量 a,那么代碼中使用的變量 a ,就是外部定義的函數(shù) a。
我們可以使用 inspect 模塊的 getclosurevars 獲取閉包變量。
- 注意, 我們沒(méi)有執(zhí)行函數(shù) b
- 得到的是一個(gè) ClosureVars 對(duì)象。其中有一個(gè) globals 屬性,可以獲取函數(shù)中全局閉包變量映射表(字典)
注意字典的 value 是函數(shù)對(duì)象。有了函數(shù)對(duì)象,我們就可以獲取它的一切信息。比如函數(shù)定義在哪個(gè)文件的哪一行,有什么參數(shù)等等。
現(xiàn)在,可以把功能封裝起來(lái),看起來(lái)像這樣子:
- 行37:我們只關(guān)注函數(shù)之間的調(diào)用,所以這里做了過(guò)濾
這樣子調(diào)用:
準(zhǔn)確控制
但是,現(xiàn)在是通過(guò)我們手工傳入函數(shù) b ,這樣子太麻煩了。在實(shí)際使用中,我們希望直接調(diào)用一個(gè)函數(shù),就能自動(dòng)檢測(cè)當(dāng)前環(huán)境所有的全局變量,并找出調(diào)用關(guān)系。
有小伙伴可能會(huì)想到,可以用 globals 函數(shù)獲取所有的全局變量字典。但是不適合我們的情況。因?yàn)槲覀兊墓δ芎瘮?shù)是單獨(dú)定義在一個(gè)模塊文件中。
如果在我們定義的函數(shù)中使用 globals,只會(huì)獲取到當(dāng)前模塊的全局變量。
此時(shí)仍然可以使用 inspect 模塊的 currentframe 獲取當(dāng)前調(diào)用幀棧,從而獲取上一層幀棧:
這里的意思就是:"誰(shuí)調(diào)用我,我就拿了誰(shuí)的全局變量"。
剩下就非常簡(jiǎn)單,遍歷這個(gè)字典,篩選出函數(shù)對(duì)象,然后調(diào)用之前定義的 get_func_relationships :
- 行81:得到的是一個(gè) 列表中的列表
- 行80:使用 itertools 模塊的 chain 給展開(kāi)成一層列表
這里還存在一些問(wèn)題,我們希望它不要什么函數(shù)都獲取,由使用者為需要檢測(cè)關(guān)系的函數(shù)打上標(biāo)記。比如:
只有打上 @check 裝飾器的函數(shù),才需要獲取調(diào)用關(guān)系。
只需要?jiǎng)?chuàng)建一個(gè)類(lèi)即可:
裝飾器知識(shí)點(diǎn)以前就有講解。
我們需要把之前的功能函數(shù)中的目標(biāo)類(lèi)型判斷修改為 TargetFn :
一切就緒:
- 行1:使用時(shí),先導(dǎo)入
- 行8:需要檢測(cè)的函數(shù),打上裝飾器
- 行40:只需要在最后調(diào)用 build_all_relationships 即可
有了關(guān)系信息,做功能界面就沒(méi)有太大難度了。