長(zhǎng)篇大論P(yáng)ython生成器
ython生成器是什么
一句話解釋:包含了yield關(guān)鍵字的函數(shù)就是生成器,它的返回值是一個(gè)生成器對(duì)象。我簡(jiǎn)單畫了個(gè)示意圖:
yield相當(dāng)于return。
函數(shù)遇到y(tǒng)ield就暫停,保存當(dāng)前信息,返回yield的值。
在下次執(zhí)行next()時(shí),從當(dāng)前位置繼續(xù)執(zhí)行。
比較有意思的事情是,曾經(jīng)有人建議生成器函數(shù)不應(yīng)該使用def,而應(yīng)該發(fā)明一個(gè)新的關(guān)鍵字比如gen,但是Python之父Guido并沒(méi)有同意這樣做。
生成器函數(shù)的工作原理
先通過(guò)一個(gè)簡(jiǎn)單示例來(lái)說(shuō)明生成器的行為:
- # 定義一個(gè)生成器
- >>> def gen_123():
- ... yield 1
- ... yield 2
- ... yield 3
- ...
- # 生成器本身是個(gè)函數(shù)
- >>> gen_123
- <function gen_123 at 0x0000019F60710790>
- # 返回值是生成器對(duì)象
- >>> gen_123()
- <generator object gen_123 at 0x0000019F606AC040>
- # 生成器也是迭代器
- >>> for i in gen_123():
- ... print(i)
- ...
- 1
- 2
- 3
- # 驗(yàn)證生成器也是迭代器,定義迭代器g
- >>> g = gen_123()
- # 可以通過(guò)next()獲取yield生成的下一個(gè)元素
- >>> next(g)
- 1
- >>> next(g)
- 2
- >>> next(g)
- 3
- >>> next(g)
- Traceback (most recent call last):
- File "<input>", line 1, in <module>
- StopIteration
生成器的原理就是:
- 生成器函數(shù)會(huì)創(chuàng)建一個(gè)生成器對(duì)象。
- 把生成器傳給next()函數(shù)時(shí),生成器函數(shù)會(huì)執(zhí)行函數(shù)定義體中的下一個(gè)yield語(yǔ)句,返回產(chǎn)出的值,并在當(dāng)前位置暫停。
- 函數(shù)的定義體返回時(shí),外層的生成器對(duì)象會(huì)拋出StopIteration異常
yield關(guān)鍵字一般是和for循環(huán)搭配使用的,在for循環(huán)中會(huì)隱式調(diào)用next()函數(shù)。
生成器的作用其實(shí)是解決內(nèi)存的問(wèn)題,比如我們都知道Python的正則表達(dá)式有一個(gè)re.findall()函數(shù),它會(huì)把所有匹配到的元素都一次性寫入內(nèi)存中,假如匹配到的數(shù)據(jù)很多,就會(huì)占用大量的內(nèi)存。為了解決這個(gè)問(wèn)題,Python3有一個(gè)re.finditer()函數(shù),返回的就是一個(gè)生成器,取值時(shí)才生成數(shù)據(jù)放入內(nèi)存中,能節(jié)省大量?jī)?nèi)存。
標(biāo)準(zhǔn)庫(kù)中的生成器函數(shù)
實(shí)現(xiàn)生成器時(shí)要知道標(biāo)準(zhǔn)庫(kù)中有什么可用,否則很可能會(huì)重新發(fā)明輪子。有些是內(nèi)置的,有些在itertools模塊中,有些functools模塊中。
用于過(guò)濾的生成器函數(shù)
從輸入的可迭代對(duì)象中產(chǎn)出元素的子集,而且不修改元素本身。
用于映射的生成器函數(shù)
在輸入的單個(gè)可迭代對(duì)象中的各個(gè)元素上做計(jì)算,然后返回結(jié)果。
合并多個(gè)可迭代對(duì)象的生成器函數(shù)
從輸入的多個(gè)可迭代對(duì)象中產(chǎn)出元素。
把輸入的各個(gè)元素?cái)U(kuò)展成多個(gè)輸出元素的生成器函數(shù)
從一個(gè)元素中產(chǎn)出多個(gè)值,擴(kuò)展輸入的可迭代對(duì)象。
用于重新排列元素的生成器函數(shù)
產(chǎn)出輸入的可迭代對(duì)象中的全部元素,不過(guò)會(huì)以某種方式重新排列。
yield from
yield from是Python3.3新出現(xiàn)的句法,它的作用是把不同的生成器結(jié)合在一起使用。
比如生成器函數(shù)需要產(chǎn)出另一個(gè)生成器生成的值,傳統(tǒng)的解決辦法是使用for循環(huán):
- def chain(*iterables):
- for it in iterables:
- for i in it:
- yield i
- s = "ABC"
- t = tuple(range(3))
- print(list(chain(s, t))) # ["A", "B", "C", 0, 1, 2]
改成yield from:
- def chain(*iterables):
- for it in iterables:
- yield from i
完全代替了內(nèi)層的for循環(huán)。
參考資料:
《流暢的Python》第14章 可迭代的對(duì)象、迭代器和生成器
https://www.runoob.com/python3/python3-iterator-generator.html
作者