自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

快來學(xué)學(xué)Python異步IO,輕松管理10k+并發(fā)連接

開發(fā) 后端
異步操作在計(jì)算機(jī)軟硬件體系中是一個(gè)普遍概念,根源在于參與協(xié)作的各實(shí)體處理速度上有明顯差異。軟件開發(fā)中遇到的多數(shù)情況是CPU與IO的速度不匹配,所以異步IO存在于各種編程框架中,客戶端比如瀏覽器,服務(wù)端比如node.js。本文主要分析Python異步IO。

快學(xué)學(xué)Python異步IO輕松管理10k+并發(fā)連接

異步操作在計(jì)算機(jī)軟硬件體系中是一個(gè)普遍概念,根源在于參與協(xié)作的各實(shí)體處理速度上有明顯差異。軟件開發(fā)中遇到的多數(shù)情況是CPU與IO的速度不匹配,所以異步IO存在于各種編程框架中,客戶端比如瀏覽器,服務(wù)端比如node.js。本文主要分析Python異步IO。

Python 3.4標(biāo)準(zhǔn)庫(kù)有一個(gè)新模塊asyncio,用來支持異步IO,不過目前API狀態(tài)是provisional,意味著不保證向后兼容性,甚至可能從標(biāo)準(zhǔn)庫(kù)中移除(可能性極低)。如果關(guān)注PEP和Python-Dev會(huì)發(fā)現(xiàn)該模塊醞釀了很長(zhǎng)時(shí)間,可能后續(xù)有API和實(shí)現(xiàn)上的調(diào)整,但毋庸置疑asyncio非常實(shí)用且功能強(qiáng)大,值得學(xué)習(xí)和深究。

示例

asyncio主要應(yīng)對(duì)TCP/UDP socket通信,從容管理大量連接,而無需創(chuàng)建大量線程,提高系統(tǒng)運(yùn)行效率。此處將官方文檔的一個(gè)示例做簡(jiǎn)單改造,實(shí)現(xiàn)一個(gè)HTTP長(zhǎng)連接benchmark工具,用于診斷WEB服務(wù)器長(zhǎng)連接處理能力。

功能概述:

每隔10毫秒創(chuàng)建10個(gè)連接,直到目標(biāo)連接數(shù)(比如10k),同時(shí)每個(gè)連接都會(huì)規(guī)律性的向服務(wù)器發(fā)送HEAD請(qǐng)求,以維持HTTP keepavlie。

代碼如下: 

 

  1. import argparse  
  2. import asyncio  
  3. import functools  
  4. import logging  
  5. import random  
  6. import urllib.parse  
  7. loop = asyncio.get_event_loop()  
  8. @asyncio.coroutine  
  9. def print_http_headers(no, url, keepalive):  
  10.     url = urllib.parse.urlsplit(url)  
  11.     wait_for = functools.partial(asyncio.wait_for, timeout=3, loop=loop)  
  12.     query = ('HEAD {url.path} HTTP/1.1\r\n'  
  13.              'Host: {url.hostname}\r\n'  
  14.              '\r\n').format(url=url).encode('utf-8' 
  15.     rd, wr = yield from wait_for(asyncio.open_connection(url.hostname, 80))  
  16.     while True 
  17.         wr.write(query)  
  18.         while True 
  19.             line = yield from wait_for(rd.readline())  
  20.             if not line: # end of connection  
  21.                 wr.close()  
  22.                 return no  
  23.             line = line.decode('utf-8').rstrip()  
  24.             if not line: # end of header  
  25.                 break  
  26.             logging.debug('(%d) HTTP header> %s' % (no, line))  
  27.         yield from asyncio.sleep(random.randint(1, keepalive//2))  
  28. @asyncio.coroutine  
  29. def do_requests(args):  
  30.     conn_pool = set()  
  31.     waiter = asyncio.Future()  
  32.     def _on_complete(fut):  
  33.         conn_pool.remove(fut)  
  34.         exc, res = fut.exception(), fut.result()  
  35.         if exc is not None:  
  36.             logging.info('conn#{} exception'.format(exc))  
  37.         else 
  38.             logging.info('conn#{} result'.format(res))  
  39.         if not conn_pool:  
  40.             waiter.set_result('event loop is done' 
  41.     for i in range(args.connections):  
  42.         fut = asyncio.async(print_http_headers(i, args.url, args.keepalive))  
  43.         fut.add_done_callback(_on_complete)  
  44.         conn_pool.add(fut)  
  45.         if i % 10 == 0:  
  46.             yield from asyncio.sleep(0.01)  
  47.     logging.info((yield from waiter))  
  48. def main():  
  49.     parser = argparse.ArgumentParser(description='asyncli' 
  50.     parser.add_argument('url', help='page address' 
  51.     parser.add_argument('-c''--connections', type=intdefault=1,  
  52.                         help='number of connections simultaneously' 
  53.     parser.add_argument('-k''--keepalive', type=intdefault=60,  
  54.                         help='HTTP keepalive timeout' 
  55.     args = parser.parse_args()  
  56.     logging.basicConfig(level=logging.INFO, format='%(asctime)s %(message)s' 
  57.     loop.run_until_complete(do_requests(args))  
  58.     loop.close()  
  59. if __name__ == '__main__' 
  60.     main() 

測(cè)試與分析

硬件:CPU 2.3GHz / 2 cores,RAM 2GB

軟件:CentOS 6.5(kernel 2.6.32), Python 3.3 (pip install asyncio), nginx 1.4.7

參數(shù)設(shè)置:ulimit -n 10240;nginx worker的連接數(shù)改為10240

啟動(dòng)WEB服務(wù)器,只需一個(gè)worker進(jìn)程:

 

  1. # ../sbin/nginx  
  2. # ps ax | grep nginx  
  3. 2007 ? Ss 0:00 nginx: master process ../sbin/nginx  
  4. 2008 ? S 0:00 nginx: worker process 

 

啟動(dòng)benchmark工具, 發(fā)起10k個(gè)連接,目標(biāo)URL是nginx的默認(rèn)測(cè)試頁面:

 

  1. $ python asyncli.py http://10.211.55.8/ -c 10000 

nginx日志統(tǒng)計(jì)平均每秒請(qǐng)求數(shù):

 

  1. # tail -1000000 access.log | awk '{ print $4 }' | sort | uniq -c | awk '{ cnt+=1; sum+=$1 } END { printf "avg = %d\n", sum/cnt }'  
  2. avg = 548 

 

top部分輸出:

 

  1. VIRT   RES   SHR  S %CPU  %MEM   TIME+  COMMAND  
  2. 657m   115m  3860 R 60.2  6.2   4:30.02  python  
  3. 54208  10m   848  R 7.0   0.6   0:30.79  nginx 

總結(jié):

1. Python實(shí)現(xiàn)簡(jiǎn)潔明了。不到80行代碼,只用到標(biāo)準(zhǔn)庫(kù),邏輯直觀,想象下C/C++標(biāo)準(zhǔn)庫(kù)實(shí)現(xiàn)這些功能,頓覺“人生苦短,我用Python”。

2. Python運(yùn)行效率不理想。當(dāng)連接建立后,客戶端和服務(wù)端的數(shù)據(jù)收發(fā)邏輯差不多,看上面top輸出,Python的CPU和RAM占用基本都是nginx的10倍,意味著效率相差100倍(CPU x RAM),側(cè)面說明了Python與C的效率差距。這個(gè)對(duì)比雖然有些極端,畢竟nginx不僅用C且為CPU/RAM占用做了深度優(yōu)化,但相似任務(wù)效率相差兩個(gè)數(shù)量級(jí),除非是BUG,說明架構(gòu)設(shè)計(jì)的出發(fā)點(diǎn)就是不同的,Python優(yōu)先可讀易用而性能次之,nginx就是一個(gè)高度優(yōu)化的WEB服務(wù)器,開發(fā)一個(gè)module都比較麻煩,要復(fù)用它的異步框架,簡(jiǎn)直難上加難。開發(fā)效率與運(yùn)行效率的權(quán)衡,永遠(yuǎn)都存在。

3. 單線程異步IO v.s. 多線程同步IO。上面的例子是單線程異步IO,其實(shí)不寫demo就知道多線程同步IO效率低得多,每個(gè)線程一個(gè)連接?10k個(gè)線程,僅線程棧就占用600+MB(64KB * 10000)內(nèi)存,加上線程上下文切換和GIL,基本就是噩夢(mèng)。

ayncio核心概念

以下是學(xué)習(xí)asyncio時(shí)需要理解的四個(gè)核心概念,更多細(xì)節(jié)請(qǐng)看<參考資料>

1. event loop。單線程實(shí)現(xiàn)異步的關(guān)鍵就在于這個(gè)高層事件循環(huán),它是同步執(zhí)行的。

2. future。異步IO有很多異步任務(wù)構(gòu)成,而每個(gè)異步任務(wù)都由一個(gè)future控制。

3. coroutine。每個(gè)異步任務(wù)具體的執(zhí)行邏輯由一個(gè)coroutine來體現(xiàn)。

4. generator(yield & yield from) 。在asyncio中大量使用,是不可忽視的語法細(xì)節(jié)。

參考資料

1. asyncio – Asynchronous I/O, event loop, coroutines and tasks, https://docs.python.org/3/library/asyncio.html

2. PEP 3156, Asynchronous IO Support Rebooted: the "asyncio” Module, http://legacy.python.org/dev/peps/pep-3156/

3. PEP 380, Syntax for Delegating to a Subgenerator, http://legacy.python.org/dev/peps/pep-0380/

4. PEP 342, Coroutines via Enhanced Generators, http://legacy.python.org/dev/peps/pep-0342/

5. PEP 255, Simple Generators, http://legacy.python.org/dev/peps/pep-0255/

6. asyncio source code, http://hg.python.org/cpython/file/3.4/Lib/asyncio/ 

責(zé)任編輯:龐桂玉 來源: 馬哥Linux運(yùn)維
相關(guān)推薦

2020-11-10 10:46:57

開源后臺(tái)管理系統(tǒng)Base Admin

2018-10-08 15:35:56

Python異步IO

2024-12-27 08:11:44

Python編程模式IO

2024-03-28 08:41:10

高并發(fā).NET異步編程

2023-10-20 08:01:08

2020-03-23 15:35:36

Java工具類Hutool

2021-01-09 13:59:49

異步IO驅(qū)動(dòng)式

2019-11-28 16:48:00

華為Mate X

2023-12-06 07:28:47

阻塞IO異步IO

2020-04-14 13:15:27

k3sSSL證書樹莓派

2012-07-17 10:54:49

AJAX

2023-04-12 18:36:20

IO框架內(nèi)核

2023-08-01 08:43:29

Python多線程

2023-03-31 13:01:31

PythonCelery驗(yàn)證

2011-12-13 12:32:54

JavaNIO

2015-10-28 14:45:35

ORACLE AIO異步IO

2015-10-28 17:39:04

ORACLE AIO異步IO

2014-12-09 14:07:50

2024-01-31 08:50:41

Guava并發(fā)工具

2021-09-18 14:46:07

手機(jī)數(shù)據(jù)隱私
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)