Python 并發(fā)編程從入門到進(jìn)階
Python多線程
Python有真正的多線程嗎?我本來以為是沒有的。因?yàn)镃Python解釋器本身就不是線程安全的,因此有全局解釋器鎖(GIL),一次只允許使用一個(gè)線程執(zhí)行Python字節(jié)碼。換句話說,Python即便是有多線程,也會受GIL限制,按順序執(zhí)行。所以我就以為Python是沒有多線程的,也就是一個(gè)Python進(jìn)程不能同時(shí)使用多個(gè)CPU核心。然而,Python標(biāo)準(zhǔn)庫中所有執(zhí)行阻塞型I/O操作的函數(shù),在等待操作系統(tǒng)返回結(jié)果時(shí),都會釋放GIL,允許其他線程運(yùn)行。這就意味著Python線程在I/O密集型應(yīng)用中還是可以發(fā)揮作用的,比如一個(gè)Python線程等待網(wǎng)絡(luò)響應(yīng)時(shí),阻塞型I/O函數(shù)會釋放GIL,再運(yùn)行一個(gè)線程。再比如time.sleep()函數(shù)也會釋放GIL。
Python多進(jìn)程
但是對于CPU密集型應(yīng)用來說,要想利用所有可用的CPU核心,就得使用多進(jìn)程,規(guī)避GIL。
多線程與多進(jìn)程對比
什么時(shí)候用多線程?什么時(shí)候用多進(jìn)程?
I/O密集型應(yīng)用使用多線程,CPU密集型應(yīng)用使用多進(jìn)程。
什么是I/O密集型應(yīng)用?什么是CPU密集型應(yīng)用?
簡單來說,I/O密集一般涉及到網(wǎng)絡(luò)、磁盤IO。而CPU密集指的是計(jì)算比較多。
創(chuàng)建多線程可以使用concurrent.futures,創(chuàng)建多進(jìn)程可以使用multiprocessing。
多線程與協(xié)程對比
多線程存在著切換開銷,同時(shí)為了避免寫變量沖突,在控制共享資源時(shí)需要加鎖,因此編寫程序會比較復(fù)雜比較困難。而協(xié)程是通過單線程實(shí)現(xiàn)的并發(fā),既能自由切換,也不需要鎖機(jī)制,執(zhí)行效率要高很多。
多線程和協(xié)程有個(gè)共同點(diǎn)是只對I/O密集型應(yīng)用有效,因?yàn)镚IL限制。如果想處理CPU密集型應(yīng)用,那么可以結(jié)合多進(jìn)程一起使用,以提高CPU使用率。
asyncio包
asyncio包比較多用來實(shí)現(xiàn)Python協(xié)程并發(fā),原書在這一章節(jié)引用了很多示例,穿插了很多代碼,導(dǎo)致我看起來有點(diǎn)亂,不是很清楚到底該怎么使用這個(gè)包。所以我看了一下官方文檔:
https://docs.python.org/3/library/asyncio.html
從Python3.5開始引入了async和await,替代了@asyncio.coroutine和yield from語法,語義更簡潔更明確了。并且從Python3.7開始引入了asyncio.run(),替代了這一串代碼:
- loop = asyncio.get_event_loop()
- try:
- loop.run_until_complete(main())
- finally:
- loop.close()
創(chuàng)建task的語法也發(fā)生了變化,可以用asyncio.create_task:
- async def coro():
- ...
- # In Python 3.7+
- task = asyncio.create_task(coro())
- ...
- # This works in all Python versions but is less readable
- task = asyncio.ensure_future(coro())
- ...
對于多個(gè)并行task可以用asyncio.gather,替代asyncio.wait:
- task_list = []
- for i in range(5):
- task = asyncio.create_task(async_func(i))
- task_list.append(task)
- done, pending = await asyncio.wait(task_list, timeout=None)
- for done_task in done:
- print((f"[{current_time()}] 得到執(zhí)行結(jié)果 {done_task.result()}"))
- task_list = []
- for i in range(5):
- task = asyncio.create_task(func(i))
- task_list.append(task)
- results = await asyncio.gather(*task_list)
- for result in results:
- print((f"[{current_time()}] 得到執(zhí)行結(jié)果 {result}"))
所以對于第三方包的學(xué)習(xí),最好是看看最新的官方文檔,說不定已經(jīng)進(jìn)行了很多優(yōu)化。
最后,完結(jié),撒花。