自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

四種高性能數(shù)據(jù)類型,Python collections助你優(yōu)化代碼、簡潔任務(wù)

開發(fā) 后端
在這篇文章中,機(jī)器學(xué)習(xí)工程師 George Seif 介紹了 Python collections 模塊很受歡迎的四種數(shù)據(jù)類型以及它們各自的使用方法。這些數(shù)據(jù)類型可以對代碼進(jìn)行優(yōu)化,進(jìn)而實(shí)現(xiàn)更簡潔的任務(wù)執(zhí)行。

在這篇文章中,機(jī)器學(xué)習(xí)工程師 George Seif 介紹了 Python collections 模塊很受歡迎的四種數(shù)據(jù)類型以及它們各自的使用方法。這些數(shù)據(jù)類型可以對代碼進(jìn)行優(yōu)化,進(jìn)而實(shí)現(xiàn)更簡潔的任務(wù)執(zhí)行。

[[281237]]

Python 的最大優(yōu)勢之一就是它有各種各樣的模塊和軟件包可供選擇。這些模塊和包將 Python 的功能擴(kuò)展到了許多流行領(lǐng)域,包括機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)、Web 開發(fā)和前端等。其中表現(xiàn)最好的一個(gè)就是 Python 內(nèi)置的 collections 模塊了。

一般而言,Python 中的 collections 模塊是用于存儲(chǔ)列表、字典、元組以及集等數(shù)據(jù)集合的容器。這些容器嵌入在 Python 中,可以實(shí)現(xiàn)開箱即用。collections 模塊提供了額外的高性能數(shù)據(jù)類型,它們可以優(yōu)化代碼,讓一些任務(wù)變得更加簡潔。

Counter

官方文檔:https://docs.python.org/2/library/collections.html#collections.Counter

Counter 是 dictionary 對象的子類。collections 模塊中的 Counter() 函數(shù)會(huì)接收一個(gè)諸如 list 或 tuple 的迭代器,然后返回一個(gè) Counter dictionary。這個(gè) dictionary 的鍵是該迭代器中的唯一元素,每個(gè)鍵的值是迭代器元素的計(jì)數(shù)。

首先,我們需要從 collections 包中導(dǎo)入 Counter: 

  1. from collections import Counter 

如果要?jiǎng)?chuàng)建一個(gè) Counter 對象,我們也要像對待其他對象類一樣,先將它分配給一個(gè)變量,而傳遞給 Counter 對象的惟一變量即是迭代器。 

  1. lst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1] 
  2. counter = Counter(lst) 

如果我們使用簡單的 print 函數(shù)(print(counter))把這個(gè) Counter 打印出來,則會(huì)得到一些與 dictionary 稍微類似的輸出: 

  1. Counter({1: 7, 2: 5, 3: 3}) 

你可以用這些鍵值訪問任何 Counter 項(xiàng)。這與從標(biāo)準(zhǔn)的 Python dictionary 中獲取元素的方法完全相同。 

  1. lst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1] 
  2. counter = Counter(lst) 
  3. print(counter[1]) 

most_common() 函數(shù)

目前來說,Counter 對象中最有用的函數(shù)是 most_common()。當(dāng)它應(yīng)用于一個(gè) Counter 對象時(shí),會(huì)返回一個(gè) list,這個(gè) list 包含了前 N 個(gè)常見的元素及其計(jì)數(shù),它們按照常見度降序排列。 

  1. lst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1] 
  2. counter = Counter(lst) 
  3. print(counter.most_common(2)) 

上述代碼會(huì)打印出以下 tuples 的 list。 

  1. [(1, 7), (2, 5)] 

每個(gè) tuple 的首個(gè)元素是 list 中的唯一項(xiàng),第二個(gè)元素是計(jì)數(shù)值。對于「獲取 list 中前 3 常見的元素及其計(jì)數(shù)」這樣的問題,這會(huì)是一種快速且簡單的方法。

如果要了解更多關(guān)于 Counter 的功能,可以查看官方文檔。

defaultdict

官方文檔:https://docs.python.org/2/library/collections.html#collections.defaultdict

defaultdict 的工作方式和平常的 python dictionary 完全相同,只是當(dāng)你試圖訪問一個(gè)不存在的鍵時(shí),它不會(huì)報(bào)錯(cuò),而是會(huì)使用默認(rèn)值初始化這個(gè)鍵。默認(rèn)值是根據(jù)在創(chuàng)建 defaultdict 對象時(shí)作為參數(shù)輸入的數(shù)據(jù)類型自動(dòng)設(shè)置的。下面的代碼就是一個(gè)例子。

相反,它會(huì)使用默認(rèn)值初始化這個(gè)鍵。默認(rèn)值是根據(jù)在創(chuàng)建 defaultdict 對象時(shí)作為參數(shù)輸入的數(shù)據(jù)類型自動(dòng)設(shè)置的。下面的代碼就是一個(gè)例子。 

  1. from collections import defaultdict 
  2.  
  3. names_dict = defaultdict(int
  4. names_dict["Bob"] = 1 
  5. names_dict["Katie"] = 2 
  6. sara_number = names_dict["Sara"
  7. print(names_dict) 

在上面的示例中,傳遞給 defaultdict 對象的默認(rèn)值是 int。然后每個(gè)鍵得到了一個(gè)值,也就是「Bob」和「Katie」各獲得了一個(gè)數(shù)字。但是在最后一行,我們試著訪問了一個(gè)尚未定義的鍵,即「Sara」。

在普通 dictionary 中,這種操作會(huì)報(bào)錯(cuò)。但是使用 defaultdict 時(shí),將自動(dòng)為「Sara」初始化一個(gè)新鍵,其值 0 對應(yīng)于我們的 int 數(shù)據(jù)類型。因此,最后一行可以把這「Bob」、「Katie」和「Sara」以及對應(yīng)的值都打印出來。

  1. defaultdict(<class 'int'>, {'Bob': 1, 'Katie': 2, 'Sara': 0}) 

如果我們改用 list 來初始化我們的 defaultdict,也就是 names_dict = defaultdict(list),那么「Sara」的值將被初始化成一個(gè)空列表 [],打印來的內(nèi)容就變成了:

  1. defaultdict(<class 'int'>, {'Bob': 1, 'Katie': 2, 'Sara': []}) 

如果要了解更多關(guān)于 defaultdict 的功能,可以查看官方文檔。

deque

官方文檔:https://docs.python.org/2/library/collections.html#collections.deque

queue 是計(jì)算機(jī)科學(xué)中的一種基礎(chǔ)數(shù)據(jù)架構(gòu),它遵循先進(jìn)先出(First-In-First-Out,F(xiàn)IFO)的原則。簡單來說,就是添加到 queue 中的第一個(gè)對象也必須是要第一個(gè)刪除。我們只能在 queue 前面插入內(nèi)容,也只能從后面刪除內(nèi)容——無法對中間內(nèi)容進(jìn)行操作。

collections 庫中的 deque 對該功能進(jìn)行了優(yōu)化。這個(gè)方法的一個(gè)關(guān)鍵特性是保持隊(duì)列長度一直不變,也就是說,如果你將 queue 的最大大小設(shè)置為 10,那么 deque 將根據(jù) FIFO 原則添加和刪除元素,以保持 queue 的最大大小為 10。這是迄今為止 Python 中使用 queue 的最好方法了。

再來看一個(gè)例子。我們先創(chuàng)建了一個(gè) deque 對象,然后用從 1 到 10 的整數(shù)初始化它。 

  1. from collections import deque 
  2.  
  3. my_queue = deque(maxlen=10) 
  4.  
  5. for i in range(10): 
  6.     my_queue.append(i+1) 
  7.  
  8. print(my_queue) 

在上面的代碼中,我們首先初始化 deque,指定它的最大長度為 10。然后,我們通過 for loop 將值插入到 queue 中。注意這里我們使用了與常見 Python list 相同的方式填充 queue。最后,我們把結(jié)果打印出來。 

  1. deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 10], maxlen=10) 

因?yàn)槲覀兊?queue 被設(shè)置成 maxlen=10,而 loop 值添加了 10 個(gè)元素,所以這個(gè) queue 包含了從 1 到 10 的所有數(shù)字。現(xiàn)在我們來看一下如果繼續(xù)向里面添加數(shù)字會(huì)發(fā)生什么。 

  1. for i in range(10, 15): 
  2.     my_queue.append(i+1) 
  3.  
  4. print(my_queue) 

在上述代碼中,我們又向 queue 中添加了 5 個(gè)元素——數(shù)字 11 到 15。但是我們的 queue 只能有 10 個(gè)元素,所以它需要?jiǎng)h除一些元素。因?yàn)?queue 必須服從 FIFO 原則,所以它刪掉了前五個(gè)插入到 queue 中的元素,按照插入順序就是 [1, 2, 3, 4, 5]。打印的結(jié)果如下: 

  1. deque([6, 7, 8, 9, 10, 11, 12, 13, 14, 15], maxlen=10) 

如果要了解更多關(guān)于 deque 的功能,可以查看官方文檔。

namedtuple

官方文檔:https://docs.python.org/2/library/collections.html#collections.namedtuple

當(dāng)你使用 python 創(chuàng)建一個(gè)常規(guī) tuple 時(shí),其元素都是通用的,而且沒有被命名。這使得你必須記住每個(gè) tuple 元素的精確索引。namedtuple 就可以解決這個(gè)問題。

namedtuple() 可以返回一個(gè) tuple,該 tuple 中的每個(gè)位置都有固定名稱,而且 namedtuple 對象也有通用名稱。要使用 namedtuple,需要先為其創(chuàng)建一個(gè)模板。下面的代碼創(chuàng)建了一個(gè)名為「Person」的 namedtuple 模板,其屬性為「name」、「age」和「job」。 

  1. from collections import namedtuple 
  2.  
  3. Person = namedtuple('Person''name age job'
  4. Once the template is created, you can use it to create namedtuple objects. Let’s create 2 namedtuple’s for 2 Persons and print out their representation. 
  5. Person = namedtuple('Person''name age job'
  6.  
  7. Mike = Person(name='Mike', age=30, job='Data Scientist'
  8. Kate = Person(name="Kate", age=28, job='Project Manager'
  9.  
  10. print(Mike) 
  11. print(Kate) 

上述代碼很容易理解,我們?yōu)?namedtuple 初始化了一個(gè)「Person」模板,并初始化了其所有的屬性。上述代碼最后的打印結(jié)果是: 

  1. Person(name='Mike', age=30, job='Data Scientist'
  2. Person(name='Kate', age=28, job='Project Manager'

因此,namedtuple 讓 tuple 的使用更簡單、更可讀且更有組織性。

如果要了解更多關(guān)于 namedtuple 的功能,可以查看官方文檔。

 

責(zé)任編輯:華軒 來源: 機(jī)器之心
相關(guān)推薦

2019-11-04 14:02:12

代碼開發(fā)AI

2010-01-12 17:21:31

百兆交換機(jī)

2021-10-24 08:37:18

網(wǎng)絡(luò)監(jiān)控網(wǎng)絡(luò)架構(gòu)網(wǎng)絡(luò)

2018-09-13 14:51:43

NoSQL數(shù)據(jù)庫大數(shù)據(jù)

2021-11-08 09:33:07

JS 字符串數(shù)據(jù)類型

2022-08-01 07:56:23

React Hook開發(fā)組件

2025-01-27 11:49:55

2017-08-01 23:44:25

數(shù)據(jù)分析數(shù)據(jù)科學(xué)數(shù)據(jù)

2020-05-19 20:13:04

物聯(lián)網(wǎng)計(jì)算類型IOT

2022-03-25 14:47:24

Javascript數(shù)據(jù)類型開發(fā)

2021-12-01 23:05:27

物聯(lián)網(wǎng)計(jì)算數(shù)據(jù)

2009-08-20 09:52:31

C#參數(shù)類型

2017-07-27 14:01:51

大數(shù)據(jù)數(shù)據(jù)分析類型模式

2013-06-28 10:17:04

2022-06-27 11:09:06

邊緣計(jì)算

2009-07-08 18:20:21

JDBC驅(qū)動(dòng)

2022-10-09 18:16:01

Flowable設(shè)置ReceiveTas

2009-09-08 17:20:01

C#排序算法

2009-02-25 09:52:14

類型轉(zhuǎn)換.NET 強(qiáng)制轉(zhuǎn)型

2023-10-21 21:13:00

索引SQL工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)