自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Python內(nèi)存管理大揭秘

開(kāi)發(fā) 后端
這里以Python語(yǔ)言為例子,說(shuō)明一門動(dòng)態(tài)類型的、面向?qū)ο蟮恼Z(yǔ)言的內(nèi)存管理方式。

 前言

語(yǔ)言的內(nèi)存管理是語(yǔ)言設(shè)計(jì)的一個(gè)重要方面。它是決定語(yǔ)言性能的重要因素。無(wú)論是C語(yǔ)言的手工管理,還是Java的垃圾回收,都成為語(yǔ)言最重要的特征。這里以Python語(yǔ)言為例子,說(shuō)明一門動(dòng)態(tài)類型的、面向?qū)ο蟮恼Z(yǔ)言的內(nèi)存管理方式。 

對(duì)象的內(nèi)存使用

賦值語(yǔ)句是語(yǔ)言最常見(jiàn)的功能了。但即使是最簡(jiǎn)單的賦值語(yǔ)句,也可以很有內(nèi)涵。Python的賦值語(yǔ)句就很值得研究。 

  1. a = 1 

整數(shù)1為一個(gè)對(duì)象。而a是一個(gè)引用。利用賦值語(yǔ)句,引用a指向?qū)ο?。Python是動(dòng)態(tài)類型的語(yǔ)言(參考動(dòng)態(tài)類型),對(duì)象與引用分離。Python像使用“筷子”那樣,通過(guò)引用來(lái)接觸和翻動(dòng)真正的食物——對(duì)象。

[[360430]]

 引用和對(duì)象

為了探索對(duì)象在內(nèi)存的存儲(chǔ),我們可以求助于Python的內(nèi)置函數(shù)id()。它用于返回對(duì)象的身份(identity)。其實(shí),這里所謂的身份,就是該對(duì)象的內(nèi)存地址。 

  1. a = 1  
  2. print(id(a))  
  3. print(hex(id(a))) 

在我的計(jì)算機(jī)上,它們返回的是: 

  1. 11246696  
  2. '0xab9c68' 

分別為內(nèi)存地址的十進(jìn)制和十六進(jìn)制表示。

在Python中,整數(shù)和短小的字符,Python都會(huì)緩存這些對(duì)象,以便重復(fù)使用。當(dāng)我們創(chuàng)建多個(gè)等于1的引用時(shí),實(shí)際上是讓所有這些引用指向同一個(gè)對(duì)象。 

  1. a = 1  
  2. b = 1  
  3. print(id(a))  
  4. print(id(b)) 

上面程序返回 

  1. 11246696  
  2. 11246696 

可見(jiàn)a和b實(shí)際上是指向同一個(gè)對(duì)象的兩個(gè)引用。

為了檢驗(yàn)兩個(gè)引用指向同一個(gè)對(duì)象,我們可以用is關(guān)鍵字。is用于判斷兩個(gè)引用所指的對(duì)象是否相同。 

  1. # True  
  2. a = 1  
  3. b = 1  
  4. print(a is b) 
  5. # True  
  6. a = "good"  
  7. b = "good"  
  8. print(a is b)  
  9. # False  
  10. a = "very good morning"  
  11. b = "very good morning"  
  12. print(a is b)  
  13. # False  
  14. a = []  
  15. b = []  
  16. print(a is b) 

上面的注釋為相應(yīng)的運(yùn)行結(jié)果??梢钥吹剑捎赑ython緩存了整數(shù)和短字符串,因此每個(gè)對(duì)象只存有一份。比如,所有整數(shù)1的引用都指向同一對(duì)象。即使使用賦值語(yǔ)句,也只是創(chuàng)造了新的引用,而不是對(duì)象本身。長(zhǎng)的字符串和其它對(duì)象可以有多個(gè)相同的對(duì)象,可以使用賦值語(yǔ)句創(chuàng)建出新的對(duì)象。

在Python中,每個(gè)對(duì)象都有存有指向該對(duì)象的引用總數(shù),即引用計(jì)數(shù)(reference count)。

我們可以使用sys包中的getrefcount(),來(lái)查看某個(gè)對(duì)象的引用計(jì)數(shù)。需要注意的是,當(dāng)使用某個(gè)引用作為參數(shù),傳遞給getrefcount()時(shí),參數(shù)實(shí)際上創(chuàng)建了一個(gè)臨時(shí)的引用。因此,getrefcount()所得到的結(jié)果,會(huì)比期望的多1。 

  1. from sys import getrefcount  
  2. a = [1, 2, 3]  
  3. print(getrefcount(a))  
  4. b = a  
  5. print(getrefcount(b)) 

由于上述原因,兩個(gè)getrefcount將返回2和3,而不是期望的1和2。 

對(duì)象引用對(duì)象

Python的一個(gè)容器對(duì)象(container),比如表、詞典等,可以包含多個(gè)對(duì)象。實(shí)際上,容器對(duì)象中包含的并不是元素對(duì)象本身,是指向各個(gè)元素對(duì)象的引用。

我們也可以自定義一個(gè)對(duì)象,并引用其它對(duì)象: 

  1. class from_obj(object):  
  2.     def __init__(self, to_obj):  
  3.         self.to_obj = to_obj  
  4. b = [1,2,3]  
  5. a = from_obj(b)  
  6. print(id(a.to_obj))  
  7. print(id(b)) 

可以看到,a引用了對(duì)象b。

對(duì)象引用對(duì)象,是Python最基本的構(gòu)成方式。即使是a = 1這一賦值方式,實(shí)際上是讓詞典的一個(gè)鍵值"a"的元素引用整數(shù)對(duì)象1。該詞典對(duì)象用于記錄所有的全局引用。該詞典引用了整數(shù)對(duì)象1。我們可以通過(guò)內(nèi)置函數(shù)globals()來(lái)查看該詞典。

當(dāng)一個(gè)對(duì)象A被另一個(gè)對(duì)象B引用時(shí),A的引用計(jì)數(shù)將增加1。 

  1. from sys import getrefcount  
  2. a = [1, 2, 3]  
  3. print(getrefcount(a))  
  4. b = [a, a]  
  5. print(getrefcount(a)) 

由于對(duì)象b引用了兩次a,a的引用計(jì)數(shù)增加了2。

容器對(duì)象的引用可能構(gòu)成很復(fù)雜的拓?fù)浣Y(jié)構(gòu)。我們可以用objgraph包來(lái)繪制其引用關(guān)系,比如 

  1. x = [1, 2, 3]  
  2. y = [x, dict(key1=x)]  
  3. z = [y, (x, y)]  
  4. import objgraph  
  5. objgraph.show_refs([z], filename='ref_topo.png'

objgraph是Python的一個(gè)第三方包。安裝之前需要安裝xdot。 

  1. sudo apt-get install xdot  
  2. sudo pip install objgraph 

objgraph官網(wǎng):http://mg.pov.lt/objgraph/

兩個(gè)對(duì)象可能相互引用,從而構(gòu)成所謂的引用環(huán)(reference cycle)。 

  1. a = []  
  2. b = [a]  
  3. a.append(b) 

即使是一個(gè)對(duì)象,只需要自己引用自己,也能構(gòu)成引用環(huán)。 

  1. a = []  
  2. a.append(a)  
  3. print(getrefcount(a)) 

引用環(huán)會(huì)給垃圾回收機(jī)制帶來(lái)很大的麻煩,我將在后面詳細(xì)敘述這一點(diǎn)。 

引用減少

某個(gè)對(duì)象的引用計(jì)數(shù)可能減少。比如,可以使用del關(guān)鍵字刪除某個(gè)引用: 

  1. from sys import getrefcount  
  2. a = [1, 2, 3]  
  3. b = a  
  4. print(getrefcount(b))  
  5. del a  
  6. print(getrefcount(b))  

del也可以用于刪除容器元素中的元素,比如: 

  1. a = [1,2,3]  
  2. del a[0]  
  3. print(a) 

如果某個(gè)引用指向?qū)ο驛,當(dāng)這個(gè)引用被重新定向到某個(gè)其他對(duì)象B時(shí),對(duì)象A的引用計(jì)數(shù)減少: 

  1. from sys import getrefcount  
  2. a = [1, 2, 3]  
  3. b = a  
  4. print(getrefcount(b))  
  5. a = 1  
  6. print(getrefcount(b))  

垃圾回收

吃太多,總會(huì)變胖,Python也是這樣。當(dāng)Python中的對(duì)象越來(lái)越多,它們將占據(jù)越來(lái)越大的內(nèi)存。不過(guò)你不用太擔(dān)心Python的體形,它會(huì)乖巧的在適當(dāng)?shù)臅r(shí)候“減肥”,啟動(dòng)垃圾回收(garbage collection),將沒(méi)用的對(duì)象清除。在許多語(yǔ)言中都有垃圾回收機(jī)制,比如Java和Ruby。盡管最終目的都是塑造苗條的提醒,但不同語(yǔ)言的減肥方案有很大的差異 。

[[360431]]

從基本原理上,當(dāng)Python的某個(gè)對(duì)象的引用計(jì)數(shù)降為0時(shí),說(shuō)明沒(méi)有任何引用指向該對(duì)象,該對(duì)象就成為要被回收的垃圾了。比如某個(gè)新建對(duì)象,它被分配給某個(gè)引用,對(duì)象的引用計(jì)數(shù)變?yōu)?。如果引用被刪除,對(duì)象的引用計(jì)數(shù)為0,那么該對(duì)象就可以被垃圾回收。比如下面的表: 

  1. a = [1, 2, 3]  
  2. del a 

del a后,已經(jīng)沒(méi)有任何引用指向之前建立的[1, 2, 3]這個(gè)表。用戶不可能通過(guò)任何方式接觸或者動(dòng)用這個(gè)對(duì)象。這個(gè)對(duì)象如果繼續(xù)待在內(nèi)存里,就成了不健康的脂肪。當(dāng)垃圾回收啟動(dòng)時(shí),Python掃描到這個(gè)引用計(jì)數(shù)為0的對(duì)象,就將它所占據(jù)的內(nèi)存清空。

然而,減肥是個(gè)昂貴而費(fèi)力的事情。垃圾回收時(shí),Python不能進(jìn)行其它的任務(wù)。頻繁的垃圾回收將大大降低Python的工作效率。如果內(nèi)存中的對(duì)象不多,就沒(méi)有必要總啟動(dòng)垃圾回收。所以,Python只會(huì)在特定條件下,自動(dòng)啟動(dòng)垃圾回收。當(dāng)Python運(yùn)行時(shí),會(huì)記錄其中分配對(duì)象(object allocation)和取消分配對(duì)象(object deallocation)的次數(shù)。當(dāng)兩者的差值高于某個(gè)閾值時(shí),垃圾回收才會(huì)啟動(dòng)。

我們可以通過(guò)gc模塊的get_threshold()方法,查看該閾值: 

  1. import gc  
  2. print(gc.get_threshold()) 

返回(700, 10, 10),后面的兩個(gè)10是與分代回收相關(guān)的閾值,后面可以看到。700即是垃圾回收啟動(dòng)的閾值。可以通過(guò)gc中的set_threshold()方法重新設(shè)置。

我們也可以手動(dòng)啟動(dòng)垃圾回收,即使用gc.collect()。 

分代回收

Python同時(shí)采用了分代(generation)回收的策略。這一策略的基本假設(shè)是,存活時(shí)間越久的對(duì)象,越不可能在后面的程序中變成垃圾。我們的程序往往會(huì)產(chǎn)生大量的對(duì)象,許多對(duì)象很快產(chǎn)生和消失,但也有一些對(duì)象長(zhǎng)期被使用。出于信任和效率,對(duì)于這樣一些“長(zhǎng)壽”對(duì)象,我們相信它們的用處,所以減少在垃圾回收中掃描它們的頻率。

[[360432]]

小家伙要多檢查

Python將所有的對(duì)象分為0,1,2三代。所有的新建對(duì)象都是0代對(duì)象。當(dāng)某一代對(duì)象經(jīng)歷過(guò)垃圾回收,依然存活,那么它就被歸入下一代對(duì)象。垃圾回收啟動(dòng)時(shí),一定會(huì)掃描所有的0代對(duì)象。如果0代經(jīng)過(guò)一定次數(shù)垃圾回收,那么就啟動(dòng)對(duì)0代和1代的掃描清理。當(dāng)1代也經(jīng)歷了一定次數(shù)的垃圾回收后,那么會(huì)啟動(dòng)對(duì)0,1,2,即對(duì)所有對(duì)象進(jìn)行掃描。

這兩個(gè)次數(shù)即上面get_threshold()返回的(700, 10, 10)返回的兩個(gè)10。也就是說(shuō),每10次0代垃圾回收,會(huì)配合1次1代的垃圾回收;而每10次1代的垃圾回收,才會(huì)有1次的2代垃圾回收。

同樣可以用set_threshold()來(lái)調(diào)整,比如對(duì)2代對(duì)象進(jìn)行更頻繁的掃描。 

  1. import gc  
  2. gc.set_threshold(700, 10, 5) 

孤立的引用環(huán)

引用環(huán)的存在會(huì)給上面的垃圾回收機(jī)制帶來(lái)很大的困難。這些引用環(huán)可能構(gòu)成無(wú)法使用,但引用計(jì)數(shù)不為0的一些對(duì)象。 

  1. a = []  
  2. b = [a]  
  3. a.append(b)  
  4. del a  
  5. del b 

上面我們先創(chuàng)建了兩個(gè)表對(duì)象,并引用對(duì)方,構(gòu)成一個(gè)引用環(huán)。刪除了a,b引用之后,這兩個(gè)對(duì)象不可能再?gòu)某绦蛑姓{(diào)用,就沒(méi)有什么用處了。但是由于引用環(huán)的存在,這兩個(gè)對(duì)象的引用計(jì)數(shù)都沒(méi)有降到0,不會(huì)被垃圾回收。

孤立的引用環(huán)

為了回收這樣的引用環(huán),Python復(fù)制每個(gè)對(duì)象的引用計(jì)數(shù),可以記為gc_ref。假設(shè),每個(gè)對(duì)象i,該計(jì)數(shù)為gc_ref_i。Python會(huì)遍歷所有的對(duì)象i。對(duì)于每個(gè)對(duì)象i引用的對(duì)象j,將相應(yīng)的gc_ref_j減1。

 

 遍歷后的結(jié)果

在結(jié)束遍歷后,gc_ref不為0的對(duì)象,和這些對(duì)象引用的對(duì)象,以及繼續(xù)更下游引用的對(duì)象,需要被保留。而其它的對(duì)象則被垃圾回收。 

總結(jié)

Python作為一種動(dòng)態(tài)類型的語(yǔ)言,其對(duì)象和引用分離。這與曾經(jīng)的面向過(guò)程語(yǔ)言有很大的區(qū)別。為了有效的釋放內(nèi)存,Python內(nèi)置了垃圾回收的支持。Python采取了一種相對(duì)簡(jiǎn)單的垃圾回收機(jī)制,即引用計(jì)數(shù),并因此需要解決孤立引用環(huán)的問(wèn)題。Python與其它語(yǔ)言既有共通性,又有特別的地方。對(duì)該內(nèi)存管理機(jī)制的理解,是提高Python性能的重要一步。 

 

責(zé)任編輯:龐桂玉 來(lái)源: 馬哥Linux運(yùn)維
相關(guān)推薦

2010-02-02 18:34:00

Python

2010-02-03 13:37:59

Python 特性

2009-05-28 10:12:04

2017-07-06 08:21:27

VSAN加密虛擬機(jī)

2017-08-24 09:19:20

分解技術(shù)揭秘

2024-05-08 16:54:21

Python編程開(kāi)發(fā)

2021-04-28 11:20:39

Python內(nèi)存代碼

2017-07-05 16:43:52

VSAN加密虛擬化

2016-02-29 16:54:10

OpenStack混合云應(yīng)用軟件定義基礎(chǔ)設(shè)施

2022-08-16 08:12:37

操作系統(tǒng)數(shù)組CPU

2010-08-23 09:45:54

Windows Azu云計(jì)算微軟

2010-05-20 18:52:06

Eclipse使用SV

2011-12-19 20:49:16

Apple

2010-09-25 11:32:24

Java內(nèi)存泄漏

2020-01-14 12:08:32

內(nèi)存安全

2010-08-09 09:56:12

FlexBuilder

2024-08-02 14:52:00

2010-09-08 12:43:31

“隱形”木馬啟動(dòng)

2019-11-07 22:12:50

網(wǎng)絡(luò)網(wǎng)絡(luò)體檢網(wǎng)絡(luò)技術(shù)

2019-10-31 08:50:25

網(wǎng)絡(luò)網(wǎng)絡(luò)體檢網(wǎng)絡(luò)技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)