自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一日一技:等待多個(gè)線程同時(shí)結(jié)束的兩種方法

開(kāi)發(fā) 前端
我們?cè)趯?xiě)多線程代碼的時(shí)候,可能會(huì)需要等待多個(gè)線程同時(shí)結(jié)束,然后再進(jìn)行后續(xù)的流程。例如,我做了一個(gè)聚合搜索引擎,用戶輸入一個(gè)關(guān)鍵詞,我需要同時(shí)在很多個(gè)搜索引擎上搜索,然后把搜索結(jié)果匯總以后返回給用戶。

[[403063]]

我們?cè)趯?xiě)多線程代碼的時(shí)候,可能會(huì)需要等待多個(gè)線程同時(shí)結(jié)束,然后再進(jìn)行后續(xù)的流程。例如,我做了一個(gè)聚合搜索引擎,用戶輸入一個(gè)關(guān)鍵詞,我需要同時(shí)在很多個(gè)搜索引擎上搜索,然后把搜索結(jié)果匯總以后返回給用戶。

示例代碼如下:

  1. @app.get('/api/search'
  2. def search(keyword: str): 
  3.     google_result = requests.get('Google 搜索地址').text 
  4.     baidu_result = requests.get('百度搜索地址').text 
  5.     bing_result = requests.get('Bing搜索地址').text 
  6.     result = combine(google_result, baidu_result, bing_result) 
  7.     return {'success'True'result': result} 

從上面這段代碼,大家可能會(huì)發(fā)現(xiàn)一個(gè)問(wèn)題,就是在請(qǐng)求多個(gè)搜索引擎的時(shí)候是串行的,先訪問(wèn) Google,訪問(wèn)完成再訪問(wèn)百度,訪問(wèn)完成最后訪問(wèn) Bing。這樣顯然會(huì)浪費(fèi)大量的時(shí)間。

如果你不會(huì)async/await,那么為了解決這個(gè)問(wèn)題,你能想到的顯然就是使用多線程。使用3個(gè)線程同時(shí)訪問(wèn) Google、百度和 Bing,然后把結(jié)果匯總傳入combine函數(shù),不就解決問(wèn)題了嗎?

如果僅僅是啟動(dòng)多個(gè)線程,那么做法很簡(jiǎn)單:

  1. import threading 
  2.  
  3. def get_url(url): 
  4.     result = requests.get(url, headers=HEADERS).text 
  5.     return result 
  6.  
  7. @app.get('/api/search'
  8. def search(keyword: str): 
  9.     google_thead = threading.Thread(target=get_url, 'Google 搜索地址'
  10.     baidu_thread = threading.Thread(target=get_url, '百度搜索地址'
  11.     bing_thread = threading.Thread(target=get_url, 'Bing搜索地址'
  12.     google_thread.start() 
  13.     baidu_thread.start() 
  14.     bing_thread.start() 
  15.     ... 

現(xiàn)在問(wèn)題來(lái)了,三個(gè)線程確實(shí)已經(jīng)啟動(dòng)了,但你怎么知道到什么時(shí)候?yàn)橹?,所有線程都運(yùn)行完畢?

這里我們給出幾個(gè)方法。

使用 join

調(diào)用線程的.join()方法,就可以卡住主線程,直到這個(gè)子線程運(yùn)行完畢才能讓主線程繼續(xù)運(yùn)行后面的代碼。所以我們可以修改代碼為:

  1. import threading 
  2.  
  3. def get_url(url): 
  4.     result = requests.get(url, headers=HEADERS).text 
  5.     return result 
  6.  
  7. @app.get('/api/search'
  8. def search(keyword: str): 
  9.     google_thead = threading.Thread(target=get_url, 'Google 搜索地址'
  10.     baidu_thread = threading.Thread(target=get_url, '百度搜索地址'
  11.     bing_thread = threading.Thread(target=get_url, 'Bing搜索地址'
  12.     google_thread.start() 
  13.     baidu_thread.start() 
  14.     bing_thread.start() 
  15.      
  16.     google_thread.join() 
  17.     baidu_thread.join() 
  18.     bing_thread.join() 

但等一等,我怎么拿到子線程的返回呢?在默認(rèn)情況下,你確實(shí)拿不到返回的數(shù)據(jù)。所以你需要傳入一個(gè)東西去子線程接收結(jié)果。所以代碼可以改為:

  1. import threading 
  2.  
  3. def get_url(url, output): 
  4.     result = requests.get(url, headers=HEADERS).text 
  5.     output.append(result) 
  6.  
  7. @app.get('/api/search'
  8. def search(keyword: str): 
  9.     result = [] 
  10.     google_thead = threading.Thread(target=get_url, args=['Google 搜索地址', result]) 
  11.     baidu_thread = threading.Thread(target=get_url, args=['百度搜索地址', result]) 
  12.     bing_thread = threading.Thread(target=get_url, args=['Bing搜索地址', result]) 
  13.     google_thread.start() 
  14.     baidu_thread.start() 
  15.     bing_thread.start() 
  16.      
  17.     google_thread.join() 
  18.     baidu_thread.join() 
  19.     bing_thread.join() 
  20.     combine(*result) 

因?yàn)榫€程是共享內(nèi)存的,所以他們可以直接修改主線程傳入的列表。

在使用.join()的時(shí)候,需要小心不要把.join()放錯(cuò)了地方,否則你的多線程就會(huì)變成單線程。詳情可以看我的這篇文章: 等一等,你的多線程可別再亂 join 了。

ThreadPoolExecutor

Python 自帶了一個(gè)concurrent模塊,它就是專(zhuān)門(mén)用來(lái)處理并發(fā)問(wèn)題的。我們也可以使用這個(gè)模塊中的ThreadPoolExecutor來(lái)解決問(wèn)題:

  1. from concurrent.futures import ThreadPoolExecutor, as_completed 
  2.  
  3. def get_url(url): 
  4.     result = requests.get(url, headers=HEADERS).text 
  5.     return result 
  6.  
  7. @app.get('/api/search'
  8. def search(keyword: str): 
  9.     tasks = [] 
  10.     with ThreadPoolExecutor() as executor: 
  11.         for url in ['Google 搜索地址''百度搜索地址''Bing搜索地址'
  12.             task = executor.submit(get_url, url) 
  13.             tasks.append(task) 
  14.         result = [x.result() for x in as_completed(tasks)] 
  15.   
  16.     combine(*result) 
  17.     ... 

concurrent.futures里面的as_completed函數(shù)接收一個(gè)列表,列表里面是多個(gè)并發(fā)任務(wù)。當(dāng)所有并發(fā)任務(wù)都運(yùn)行結(jié)束時(shí),它才會(huì)返回一個(gè)可迭代對(duì)象。對(duì)它進(jìn)行迭代以后,每個(gè)元素的.result()就是每個(gè)子線程運(yùn)行的返回結(jié)果。

其他方法

除了上面兩個(gè)方法外,還可以使用multiprocessing.dummy里面的Pool來(lái)實(shí)現(xiàn)更簡(jiǎn)單的多線程。

本文轉(zhuǎn)載自微信公眾號(hào)「未聞Code」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系未聞Code公眾號(hào)。

 

責(zé)任編輯:武曉燕 來(lái)源: 未聞Code
相關(guān)推薦

2021-04-05 14:47:55

Python多線程事件監(jiān)控

2024-07-19 18:23:17

2021-04-27 22:15:02

Selenium瀏覽器爬蟲(chóng)

2021-10-15 21:08:31

PandasExcel對(duì)象

2022-06-28 09:31:44

LinuxmacOS系統(tǒng)

2024-11-13 09:18:09

2022-03-12 20:38:14

網(wǎng)頁(yè)Python測(cè)試

2021-04-12 21:19:01

PythonMakefile項(xiàng)目

2021-10-08 20:11:40

類(lèi)方法靜態(tài)

2023-10-28 12:14:35

爬蟲(chóng)JavaScriptObject

2021-03-12 21:19:15

Python鏈?zhǔn)?/a>調(diào)用

2024-07-30 08:16:18

Python代碼工具

2021-09-13 20:38:47

Python鏈?zhǔn)?/a>調(diào)用

2021-04-19 23:29:44

MakefilemacOSLinux

2024-07-30 08:11:16

2023-09-06 00:15:04

Pandas技巧格式

2021-05-08 19:33:51

移除字符零寬

2024-11-11 00:38:13

Mypy靜態(tài)類(lèi)型

2021-07-27 21:32:57

Python 延遲調(diào)用

2021-10-03 20:08:29

HTTP2Scrapy
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)