用復(fù)雜的方式學(xué)會(huì)數(shù)組(Python實(shí)現(xiàn)動(dòng)態(tài)數(shù)組)
Part1聊聊Python序列類(lèi)型的本質(zhì)
在本博客中,我們來(lái)聊聊探討Python的各種“序列”類(lèi),內(nèi)置的三大常用數(shù)據(jù)結(jié)構(gòu)——列表類(lèi)(list)、元組類(lèi)(tuple)和字符串類(lèi)(str)的本質(zhì)。
不知道你發(fā)現(xiàn)沒(méi)有,這些類(lèi)都有一個(gè)很明顯的共性,都可以用來(lái)保存多個(gè)數(shù)據(jù)元素,最主要的功能是:每個(gè)類(lèi)都支持下標(biāo)(索引)訪問(wèn)該序列的元素,比如使用語(yǔ)法 Seq[i]?。其實(shí)上面每個(gè)類(lèi)都是使用 數(shù)組 這種簡(jiǎn)單的數(shù)據(jù)結(jié)構(gòu)表示。
但是熟悉Python的讀者可能知道這3種數(shù)據(jù)結(jié)構(gòu)又有一些不同:比如元組和字符串是不能修改的,列表可以修改。
1、計(jì)算機(jī)內(nèi)存中的數(shù)組結(jié)構(gòu)
計(jì)算機(jī)體系結(jié)構(gòu)中,我們知道計(jì)算機(jī)主存由位信息組成,這些位通常被歸類(lèi)成更大的單元,這些單元?jiǎng)t取決于精準(zhǔn)的系統(tǒng)架構(gòu)。一個(gè)典型的單元就是一個(gè)字節(jié),相當(dāng)于8位。
計(jì)算機(jī)系統(tǒng)擁有龐大數(shù)量的存儲(chǔ)字節(jié),那么如何才能找到我們的信息存在哪個(gè)字節(jié)呢?答案就是大家平時(shí)熟知的 存儲(chǔ)地址 。基于存儲(chǔ)地址,主存中的任何字節(jié)都能被有效的訪問(wèn)。實(shí)際上,每個(gè)存儲(chǔ)字節(jié)都和一個(gè)作為其地址的唯一二進(jìn)制數(shù)字相關(guān)聯(lián)。如下圖中,每個(gè)字節(jié)均被指定了存儲(chǔ)地址:
一般來(lái)說(shuō),編程語(yǔ)言記錄標(biāo)識(shí)符和其關(guān)聯(lián)值所存儲(chǔ)的地址之間的關(guān)系。比如,當(dāng)我們聲明標(biāo)識(shí)符 x 就有可能和存儲(chǔ)器中的某一值相關(guān)聯(lián),而標(biāo)識(shí)符 y就可能和其他的值相關(guān)聯(lián)。一組相關(guān)的變量能夠一個(gè)接一個(gè)地存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器的一塊連續(xù)區(qū)域內(nèi)。我們將這種方式稱為 數(shù)組。
我們來(lái)看Python中的例子,一個(gè)文本字符串 HELLO 是以一列有序字符的形式存儲(chǔ)的,假定該字符串的每個(gè)Unicode字符需要兩個(gè)字節(jié)的存儲(chǔ)空間。最下面的數(shù)字就是該字符串的索引值。
我們可以看到,數(shù)組可以存儲(chǔ)多個(gè)值而無(wú)需構(gòu)造具有特定索引的多個(gè)變量來(lái)指定其中的每個(gè)項(xiàng)目,并且?guī)缀踉谒芯幊陶Z(yǔ)言(例如C、Java、C#、C++)中使用,但是Python更具有優(yōu)勢(shì)。Python在構(gòu)建列表時(shí),熟悉的讀者可能知道,不需要預(yù)先定義數(shù)組或列表的大小,相反,在Python中,列表具有動(dòng)態(tài)性質(zhì),我們可以不斷的往列表中添加我們想要的數(shù)據(jù)元素。接下來(lái),讓我們看看Python列表的知識(shí)(已經(jīng)熟悉的讀者可以快速瀏覽或者跳過(guò))。
2、Python列表
Python列表的操作
- 創(chuàng)建列表的語(yǔ)法格式:
[ele1, ele2, ele3, ele4, ...]
- 創(chuàng)建元組的語(yǔ)法格式:
(ele1, ele2, ele3, ele4, ...)
元組比列表的內(nèi)存空間利用率更高,因?yàn)樵M是固定不變的,所以沒(méi)有必要?jiǎng)?chuàng)建擁有剩余空間的動(dòng)態(tài)數(shù)組。
我們先在Python的IDE中創(chuàng)建一個(gè)列表,然后大致了解一下列表部分內(nèi)置操作,我們先創(chuàng)建了一個(gè)名為test_list的列表,然后修改(插入或刪除)元素,反轉(zhuǎn)或清空列表,具體如下:
我們看上面的代碼,可以看到list的相關(guān)操作——增刪改查,已經(jīng)很強(qiáng)大了,還有一些內(nèi)置方法這里并沒(méi)有做展示,留給讀者自己去發(fā)現(xiàn)并體驗(yàn)。
Python列表的內(nèi)存分配背后的基礎(chǔ)知識(shí)
因此,讓我們通過(guò)編碼實(shí)踐以及內(nèi)存中保存的數(shù)組的實(shí)際大小與給定大小之間的關(guān)系來(lái)查看這種額外的空間演示。
前往Jupyter notebook進(jìn)行練習(xí)?;蛘呤褂米约哼x擇的任何編輯器或開(kāi)發(fā)環(huán)境。復(fù)制下面編寫(xiě)的代碼。
運(yùn)行代碼,可以看到如下輸出:
現(xiàn)在,隨著我們?cè)黾恿斜淼拈L(zhǎng)度,字節(jié)也增加了。我們分析一下,Length:1
位置的元素填入列表時(shí),字節(jié)數(shù)從64跳到96,增加了32個(gè)字節(jié)。因?yàn)楸緦?shí)驗(yàn)是在64位機(jī)器上運(yùn)行的,這表明每個(gè)內(nèi)存地址是64位(即8個(gè)字節(jié))。增加的32個(gè)字節(jié)即為分配的用于存儲(chǔ)4個(gè)對(duì)象引用的數(shù)組大小。當(dāng)增加第2個(gè)、第3個(gè)或者第4個(gè)元素時(shí),內(nèi)存占用沒(méi)有任何改變。字節(jié)數(shù)96能夠提供4個(gè)對(duì)象的引用。
96\ =\ 64\ +\ 8\ \times \ 4
當(dāng)Length:10
時(shí),字節(jié)數(shù)從一開(kāi)始的64跳到192,能存下16個(gè)對(duì)象的引用,
192\ =\ 64\ +\ 8\ \times \ 16
一直到Length: 17
后又開(kāi)始跳轉(zhuǎn),所以理論上264個(gè)字節(jié)數(shù)應(yīng)該可以存下25個(gè)對(duì)象
264\ =\ 64\ +\ 8\ \times \ 25
但因?yàn)槲覀冊(cè)诖a中設(shè)置n=20,然后程序就終止了。
我們可以看到Python內(nèi)置的list類(lèi)足夠智能,知道當(dāng)需要額外的空間來(lái)分配數(shù)據(jù)時(shí),它會(huì)為它們提供額外的大小,那么這究竟是如何被實(shí)現(xiàn)的呢?
好吧,答案是動(dòng)態(tài)數(shù)組。說(shuō)到這里,不知道大家學(xué)Python列表的時(shí)候是不是這樣想的——列表很簡(jiǎn)單嘛,就是list()類(lèi)、用中括號(hào)[]括起來(lái),然后指導(dǎo)書(shū)籍或文檔上的各類(lèi)方法append、insert、pop...在各種IDE一頓操作過(guò)后,是的我覺(jué)得我學(xué)會(huì)了。
但其實(shí)背后的原理真的很不簡(jiǎn)單,比如我舉個(gè)例子:A[-1]這個(gè)操作怎么實(shí)現(xiàn)?列表切片功能怎么實(shí)現(xiàn)?如何自己寫(xiě)pop()默認(rèn)刪除列表最右邊的元素(popleft刪除最左邊簡(jiǎn)單)?...這些功能用起來(lái)爽,但真的自己實(shí)現(xiàn)太難了(我也還在學(xué)習(xí)中,大佬們請(qǐng)輕噴!)如果我們能學(xué)習(xí)并理解,肯定可以加強(qiáng)我們對(duì)數(shù)組這一結(jié)構(gòu)的理解。
3、動(dòng)態(tài)數(shù)組
什么是動(dòng)態(tài)數(shù)組
動(dòng)態(tài)數(shù)組是內(nèi)存的連續(xù)區(qū)域,其大小隨著插入新數(shù)據(jù)而動(dòng)態(tài)增長(zhǎng)。在靜態(tài)數(shù)組中,我們需要在分配時(shí)指定大小。在定義數(shù)組的時(shí)候,其實(shí)計(jì)算機(jī)已經(jīng)幫我們分配好了內(nèi)存來(lái)存儲(chǔ),實(shí)際上我們不能擴(kuò)展數(shù)組,因?yàn)樗拇笮∈枪潭ǖ?。比如:我們分配一個(gè)大小為10的數(shù)組,則不能插入超過(guò)10個(gè)項(xiàng)目。
但是動(dòng)態(tài)數(shù)組會(huì)在需要的時(shí)候自動(dòng)調(diào)整其大小。這一點(diǎn)有點(diǎn)像我們使用的Python列表,可以存儲(chǔ)任意數(shù)量的項(xiàng)目,而無(wú)需在分配時(shí)指定大小。
所以實(shí)現(xiàn)一個(gè)動(dòng)態(tài)數(shù)組的實(shí)現(xiàn)的關(guān)鍵是——如何擴(kuò)展數(shù)組?當(dāng)列表list1的大小已滿時(shí),而此時(shí)有新的元素要添加進(jìn)列表,我們會(huì)執(zhí)行一下步驟來(lái)克服其大小限制的缺點(diǎn):
- 分配具有更大容量的新數(shù)組list2
- 設(shè)置list2[i] = list1[i] (i=0,1,2,...,n-1),其中n是該項(xiàng)目的當(dāng)前編號(hào)
- 設(shè)置list1 = list2,也就是說(shuō),list2正在作為新的數(shù)組來(lái)引用我們的新列表。
- 然后,只要將新的元素插入(添加)到我們的列表list1即可。
接下來(lái)要思考的問(wèn)題是,新數(shù)組應(yīng)該多大?通常我們得做法是:新數(shù)組的大小是已滿的舊數(shù)組的2倍。我們將在Python中編程實(shí)現(xiàn)動(dòng)態(tài)數(shù)組的概念,并創(chuàng)建一個(gè)簡(jiǎn)單的代碼,很多功能不及Python強(qiáng)大。
實(shí)現(xiàn)動(dòng)態(tài)數(shù)組的Python代碼
在Python中,我們利用ctypes的內(nèi)置庫(kù)來(lái)創(chuàng)建自己的動(dòng)態(tài)數(shù)組類(lèi),因?yàn)閏types模塊提供對(duì)原始數(shù)組的支持,為了更快的對(duì)數(shù)組進(jìn)行學(xué)習(xí),所以對(duì)ctypes的知識(shí)可以查看官方文檔進(jìn)行學(xué)習(xí)。關(guān)于Python的公有方法與私有方法,我們?cè)诜椒Q前使用雙下劃線**__**使其保持隱藏狀態(tài),代碼如下:
測(cè)試動(dòng)態(tài)數(shù)組Python代碼
上面我們已經(jīng)實(shí)現(xiàn)了一個(gè)動(dòng)態(tài)數(shù)組的類(lèi),相信都很激動(dòng),接下來(lái)讓我們來(lái)測(cè)試一下,看能不能成功呢?在同一個(gè)文件下,寫(xiě)的測(cè)試代碼如下:
測(cè)試結(jié)果
激動(dòng)人心的時(shí)刻揭曉,測(cè)試結(jié)果如下。請(qǐng)結(jié)合測(cè)試代碼和數(shù)組的結(jié)構(gòu)進(jìn)行理解,如果由疏漏,歡迎大家指出。
Part2總結(jié)
通過(guò)以上的介紹,我們知道了數(shù)組存在靜態(tài)和動(dòng)態(tài)類(lèi)型。而在本博客中,我們著重介紹了什么是動(dòng)態(tài)數(shù)組,并通過(guò)Python代碼進(jìn)行實(shí)現(xiàn)。希望你能從此以復(fù)雜的方式學(xué)會(huì)數(shù)組。總結(jié)發(fā)言,其實(shí)越是簡(jiǎn)單的操作,背后實(shí)現(xiàn)原理可能很復(fù)雜。