四個(gè)鮮為人知的Python迭代過濾函數(shù)
簡介
在Python中,迭代器可以幫助你編寫更多Pythonic的代碼,并在處理長序列時(shí)提高效率。內(nèi)置的itertools模塊提供了幾個(gè)有用的函數(shù)來創(chuàng)建迭代器。
【itertools】:https://docs.python.org/3/library/itertools.html
當(dāng)你只需要遍歷迭代器、檢索序列中的元素并對其進(jìn)行處理,而無需將它們存儲在內(nèi)存中時(shí),這些函數(shù)尤其有用。今天本文將學(xué)習(xí)如何使用以下四個(gè)itertools過濾函數(shù):
- filterfalse
- takewhile
- dropwhile
- islice
接下來跟隨本文開始吧!
圖片
在開始之前:關(guān)于代碼示例的說明
在本教程中:
我們將討論的所有四個(gè)函數(shù)都返回了迭代器。為了清楚起見,本文將使用簡單的序列,并使用list()獲取包含迭代器返回的所有元素的列表。但在處理長序列時(shí),除非必要,否則請不要這樣做,因?yàn)檫@樣做會失去迭代器帶來的內(nèi)存節(jié)省。
對于簡單的謂詞函數(shù),也可以使用lambdas。但為了提高可讀性,本文將定義常規(guī)函數(shù)并將它們用作謂詞。
1. filterfalse
如果你在Python中編程已經(jīng)有一段時(shí)間了,可能已經(jīng)使用過內(nèi)置的filter函數(shù),語法如下:
filter(pred,seq)
# pred:謂詞函數(shù)
# seq:任何有效的Python可迭代對象
filter函數(shù)返回一個(gè)迭代器,該迭代器返回謂詞函數(shù)返回True的序列中的元素。
示例如下:
nums = list(range(1,11)) #[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
def is_even(n):
return n % 2 == 0
在這里,nums列表和is_even函數(shù)分別是序列和謂詞。
要獲取nums中所有偶數(shù)的列表,需要使用如下所示的filter:
nums_even = filter(is_even, nums)
print(list(nums_even))
Output >>> [2, 4, 6, 8, 10]
現(xiàn)在跟隨本文來學(xué)習(xí)一下filterfalse。本文將從itertools模塊中導(dǎo)入filterfalse函數(shù)(以及本文將要討論的所有其他函數(shù))。
正如其名稱所示,filterfalse執(zhí)行與filter函數(shù)相反的操作。它返回一個(gè)迭代器,該迭代器返回謂詞返回False的元素。以下是使用filterfalse函數(shù)的語法:
from itertools import filterfalse
filterfalse(pred,seq)
is_even函數(shù)對于nums中的所有奇數(shù)返回False。因此,使用filterfalse得到的nums_odd列表是nums中所有奇數(shù)的列表:
from itertools import filterfalse
nums_odd = filterfalse(is_even, nums)
print(list(nums_odd))
Output >>> [1, 3, 5, 7, 9]
2. takewhile
使用takewhile函數(shù)的語法如下:
from itertools import takewhile
takewhile(pred,seq)
takewhile函數(shù)返回了一個(gè)迭代器,只要謂詞函數(shù)返回True,它就會返回元素。當(dāng)謂詞函數(shù)第一次返回False時(shí),它就停止返回元素。
對于長度為n的序列,如果seq[k]是第一個(gè)使謂詞函數(shù)返回False的元素,則迭代器會返回seq[0]、seq[1]、...、seq[k-1]。
考慮以下的nums列表和謂詞函數(shù)is_less_than_5。本文使用takewhile函數(shù),如下所示:
from itertools import takewhile
def is_less_than_5(n):
return n < 5
nums = [1, 3, 5, 2, 4, 6]
filtered_nums_1 = takewhile(is_less_than_5, nums)
print(list(filtered_nums_1))
在這里,謂詞is_less_than_5對于數(shù)字5首次返回False:
Output >>> [1, 3]
3. dropwhile
從功能上講,dropwhile函數(shù)的作用與takewhile函數(shù)相反。
以下是如何使用dropwhile函數(shù)的示例:
from itertools import dropwhile
dropwhile(pred,seq)
dropwhile函數(shù)返回一個(gè)迭代器,只要謂詞為True,該迭代器就會持續(xù)刪除元素。也就是說,迭代器在謂詞第一次返回False之前不返回任何元素。一旦謂詞返回False,迭代器就會返回序列中的所有后續(xù)元素。
對于長度為n的序列,如果謂詞函數(shù)第一次返回False的元素是seq[k],那么迭代器會返回seq[k]、seq[k+1]、…、seq[n-1]。
接下來使用相同的序列和謂詞函數(shù):
from itertools import dropwhile
def is_less_than_5(n):
return n < 5
nums = [1, 3, 5, 2, 4, 6]
filtered_nums_2 = dropwhile(is_less_than_5, nums)
print(list(filtered_nums_2))
由于謂詞函數(shù)is_less_than_5第一次返回False是在元素5上,因此本文得到從5開始的序列中的所有元素:
Output >>> [5, 2, 4, 6]
4. islice
你可能已經(jīng)熟悉了對Python可迭代對象(如列表、元組和字符串)進(jìn)行切片操作。切片的語法是:iterable[start:stop:step]。
然而,這種切片操作具有以下缺點(diǎn):
- 在處理大型序列時(shí),每個(gè)切片或子序列都是一個(gè)占用內(nèi)存的副本,這可能會降低效率。
- 由于步長也可以取負(fù)值,使用起始、停止和步長值會影響可讀性。
islice函數(shù)解決了上述限制:
- 它返回一個(gè)迭代器。
- 它不允許步長取負(fù)值。
可以按以下方式使用islice函數(shù):
from itertools import islice
islice(seq,start,stop,step)
下面是使用islice函數(shù)的幾種不同方式:
- 使用islice(seq, stop)函數(shù)返回一個(gè)迭代器,該迭代器遍歷切片seq[0]、seq[1]、...、seq[stop - 1]。
- 如果指定了起始和停止值:islice(seq, start, stop),該函數(shù)會返回一個(gè)迭代器,該迭代器遍歷切片seq[start]、seq[start + 1]、...、seq[start + stop - 1]。
- 當(dāng)指定起始、停止和步長參數(shù)時(shí),該函數(shù)返回一個(gè)迭代器,該迭代器遍歷切片seq[start]、seq[start + step]、seq[start + 2*step]、...、seq[start + k*step],其中start + k*step < stop且start + (k+1)*step >= stop。
接下來以一個(gè)示例列表來更好地理解這個(gè)問題:
nums = list(range(10)) #[0,1, 2, 3, 4, 5, 6, 7, 8, 9]
現(xiàn)在,跟隨本文使用已學(xué)過的islice函數(shù)的語法。
僅使用停止值
這里本文只指定停止索引:
from itertools import islice
# 僅指定停止索引
sliced_nums = islice(nums, 5)
print(list(sliced_nums))
以下是輸出結(jié)果:
Output >>> [0, 1, 2, 3, 4]
使用起始和停止值
在這里,本文同時(shí)使用起始值和停止值:
# 指定起始和停止索引
sliced_nums = islice(nums, 2, 7)
print(list(sliced_nums))
切片從索引2開始,一直延伸到索引7但不包括索引7:
Output >>> [2, 3, 4, 5, 6]
使用起始、停止和步長值
當(dāng)本文使用起始、停止和步長值時(shí):
# 使用起始、停止和步長
sliced_nums = islice(nums, 2, 8, 2)
print(list(sliced_nums))
得到一個(gè)從索引2開始、一直延伸到索引8但不包括索引8的切片,步長為2(每隔一個(gè)元素返回一次))。
Output >>> [2, 4, 6]
總結(jié)
希望本教程能幫助你理解itertools過濾函數(shù)的基礎(chǔ)知識。通過查看一些簡單的示例,可以更好地理解這些函數(shù)的工作原理。