自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

要問技術多牛,請問IO模型知多少?

系統(tǒng)
同步異步I/O,阻塞非阻塞I/O是程序員老生常談的話題了,也是自己一直以來懵懵懂懂的一個話題。

[[331446]]

 1. 引言

同步異步I/O,阻塞非阻塞I/O是程序員老生常談的話題了,也是自己一直以來懵懵懂懂的一個話題。比如:何為同步異步?何為阻塞與非阻塞?二者的區(qū)別在哪里?阻塞在何處?為什么會有多種IO模型,分別用來解決問題?常用的框架采用的是何種I/O模型?各種IO模型的優(yōu)劣勢在哪里,適用于何種應用場景?

簡而言之,對于I/O的認知,不能僅僅停留在字面上認識,了解內(nèi)部玄機,才能深刻理解I/O,才能看清I/O相關問題的本質(zhì)。

2. I/O 的定義

I/O 的全稱是Input/Output。雖常談及I/O,但想必你也一時不能給出一個完整的定義。搜索了谷歌,發(fā)現(xiàn)也盡是些冗長的論述。要想理清I/O這個概念,我們需要從不同的視角去理解它。

2.1. 計算機視角

馮•諾伊曼計算機的基本思想中有提到計算機硬件組成應為五大部分:控制器,運算器,存儲器,輸入和輸出。其中輸入是指將數(shù)據(jù)輸入到計算機的設備,比如鍵盤鼠標;輸出是指從計算機中獲取數(shù)據(jù)的設備,比如顯示器;以及既是輸入又是輸出設備,硬盤,網(wǎng)卡等。

用戶通過操作系統(tǒng)才能完成對計算機的操作。計算機啟動時,第一個啟動的程序是操作系統(tǒng)的內(nèi)核,它將負責計算機的資源管理和進程的調(diào)度。換句話說:操作系統(tǒng)負責從輸入設備讀取數(shù)據(jù)并將數(shù)據(jù)寫入到輸出設備。

所以I/O之于計算機,有兩層意思:

I/O設備

對I/O設備的數(shù)據(jù)讀寫

對于一次I/O操作,必然涉及2個參與方,一個輸入端,一個輸出端,而又根據(jù)參與雙方的設備類型,我們又可以分為磁盤I/O,網(wǎng)絡I/O(一次網(wǎng)絡的請求響應,網(wǎng)卡)等。

2.2. 程序視角

應用程序作為一個文件保存在磁盤中,只有加載到內(nèi)存到成為一個進程才能運行。應用程序運行在計算機內(nèi)存中,必然會涉及到數(shù)據(jù)交換,比如讀寫磁盤文件,訪問數(shù)據(jù)庫,調(diào)用遠程API等等。但我們編寫的程序并不能像操作系統(tǒng)內(nèi)核一樣直接進行I/O操作。

因為為了確保操作系統(tǒng)的安全穩(wěn)定運行,操作系統(tǒng)啟動后,將會開啟保護模式:將內(nèi)存分為內(nèi)核空間(內(nèi)核對應進程所在內(nèi)存空間)和用戶空間,進行內(nèi)存隔離。我們構(gòu)建的程序?qū)⑦\行在用戶空間,用戶空間無法操作內(nèi)核空間,也就意味著用戶空間的程序不能直接訪問由內(nèi)核管理的I/O,比如:硬盤、網(wǎng)卡等。

但操作系統(tǒng)向外提供API,其由各種類型的系統(tǒng)調(diào)用(System Call)組成,以提供安全的訪問控制。所以應用程序要想訪問內(nèi)核管理的I/O,必須通過調(diào)用內(nèi)核提供的系統(tǒng)調(diào)用(system call)進行間接訪問。

所以I/O之于應用程序來說,強調(diào)的通過向內(nèi)核發(fā)起系統(tǒng)調(diào)用完成對I/O的間接訪問。換句話說應用程序發(fā)起的一次IO操作實際包含兩個階段:

IO調(diào)用階段:應用程序進程向內(nèi)核發(fā)起系統(tǒng)調(diào)用

IO執(zhí)行階段:內(nèi)核執(zhí)行IO操作并返回

2.1. 準備數(shù)據(jù)階段:內(nèi)核等待I/O設備準備好數(shù)據(jù)

2.2. 拷貝數(shù)據(jù)階段:將數(shù)據(jù)從內(nèi)核緩沖區(qū)拷貝到用戶空間緩沖區(qū)

怎么理解準備數(shù)據(jù)階段呢?對于寫請求:等待系統(tǒng)調(diào)用的完整請求數(shù)據(jù),并寫入內(nèi)核緩沖區(qū);對于讀請求:等待系統(tǒng)調(diào)用的完整請求數(shù)據(jù);(若請求數(shù)據(jù)不存在于內(nèi)核緩沖區(qū))則將外圍設備的數(shù)據(jù)讀入到內(nèi)核緩沖區(qū)。

 

要問技術多NB,請問IO模型知多少?

 

而應用程序進程在發(fā)起IO調(diào)用至內(nèi)核執(zhí)行IO返回之前,應用程序進程/線程所處狀態(tài),就是我們下面要討論的第二個話題阻塞IO與非阻塞IO。

3. IO 模型之阻塞I/O(BIO)

應用程序中進程在發(fā)起IO調(diào)用后至內(nèi)核執(zhí)行IO操作返回結(jié)果之前,若發(fā)起系統(tǒng)調(diào)用的線程一直處于等待狀態(tài),則此次IO操作為阻塞IO。阻塞IO簡稱BIO,Blocking IO。其處理流程如下圖所示:

 

要問技術多NB,請問IO模型知多少?

 

從上圖可知當用戶進程發(fā)起IO系統(tǒng)調(diào)用后,內(nèi)核從準備數(shù)據(jù)到拷貝數(shù)據(jù)到用戶空間的兩個階段期間用戶調(diào)用線程選擇阻塞等待數(shù)據(jù)返回。

因此BIO帶來了一個問題:如果內(nèi)核數(shù)據(jù)需要耗時很久才能準備好,那么用戶進程將被阻塞,浪費性能。為了提升應用的性能,雖然可以通過多線程來提升性能,但線程的創(chuàng)建依然會借助系統(tǒng)調(diào)用,同時多線程會導致頻繁的線程上下文的切換,同樣會影響性能。所以要想解決BIO帶來的問題,我們就得看到問題的本質(zhì),那就是阻塞二字。

4. IO 模型之非阻塞I/O(NIO)

那解決方案自然也容易想到,將阻塞變?yōu)榉亲枞蔷褪怯脩暨M程在發(fā)起系統(tǒng)調(diào)用時指定為非阻塞,內(nèi)核接收到請求后,就會立即返回,然后用戶進程通過輪詢的方式來拉取處理結(jié)果。也就是如下圖所示:

 

要問技術多NB,請問IO模型知多少?

 

應用程序中進程在發(fā)起IO調(diào)用后至內(nèi)核執(zhí)行IO操作返回結(jié)果之前,若發(fā)起系統(tǒng)調(diào)用的線程不會等待而是立即返回,則此次IO操作為非阻塞IO模型。非阻塞IO簡稱NIO,Non-Blocking IO。

然而,非阻塞IO雖然相對于阻塞IO大幅提升了性能,但依舊不是完美的解決方案,其依然存在性能問題,也就是頻繁的輪詢導致頻繁的系統(tǒng)調(diào)用,會耗費大量的CPU資源。比如當并發(fā)很高時,假設有1000個并發(fā),那么單位時間循環(huán)內(nèi)將會有1000次系統(tǒng)調(diào)用去輪詢執(zhí)行結(jié)果,而實際上可能只有2個請求結(jié)果執(zhí)行完畢,這就會有998次無效的系統(tǒng)調(diào)用,造成嚴重的性能浪費。有問題就要解決,那NIO問題的本質(zhì)就是頻繁輪詢導致的無效系統(tǒng)調(diào)用。

5. IO模型之IO多路復用

解決NIO的思路就是降解無效的系統(tǒng)調(diào)用,如何降解呢?我們一起來看看以下幾種IO多路復用的解決思路。

5.1. IO多路復用之select/poll

Select是內(nèi)核提供的系統(tǒng)調(diào)用,它支持一次查詢多個系統(tǒng)調(diào)用的可用狀態(tài),當任意一個結(jié)果狀態(tài)可用時就會返回,用戶進程再發(fā)起一次系統(tǒng)調(diào)用進行數(shù)據(jù)讀取。換句話說,就是NIO中N次的系統(tǒng)調(diào)用,借助Select,只需要發(fā)起一次系統(tǒng)調(diào)用就夠了。其IO流程如下所示:

 

要問技術多NB,請問IO模型知多少?

 

但是,select有一個限制,就是存在連接數(shù)限制,針對于此,又提出了poll。其與select相比,主要是解決了連接限制。

select/epoll 雖然解決了NIO重復無效系統(tǒng)調(diào)用用的問題,但同時又引入了新的問題。問題是:

用戶空間和內(nèi)核空間之間,大量的數(shù)據(jù)拷貝

內(nèi)核循環(huán)遍歷IO狀態(tài),浪費CPU時間

換句話說,select/poll雖然減少了用戶進程的發(fā)起的系統(tǒng)調(diào)用,但內(nèi)核的工作量只增不減。在高并發(fā)的情況下,內(nèi)核的性能問題依舊。所以select/poll的問題本質(zhì)是:內(nèi)核存在無效的循環(huán)遍歷。

5.2. IO多路復用之epoll

針對select/pool引入的問題,我們把解決問題的思路轉(zhuǎn)回到內(nèi)核上,如何減少內(nèi)核重復無效的循環(huán)遍歷呢?變主動為被動,基于事件驅(qū)動來實現(xiàn)。其流程圖如下所示:

 

要問技術多NB,請問IO模型知多少?

 

epoll相較于select/poll,多了兩次系統(tǒng)調(diào)用,其中epoll_create建立與內(nèi)核的連接,epoll_ctl注冊事件,epoll_wait阻塞用戶進程,等待IO事件。

 

要問技術多NB,請問IO模型知多少?

 

epoll,已經(jīng)大大優(yōu)化了IO的執(zhí)行效率,但在IO執(zhí)行的第一階段:數(shù)據(jù)準備階段都還是被阻塞的。所以這是一個可以繼續(xù)優(yōu)化的點。

6. IO 模型之信號驅(qū)動IO(SIGIO)

信號驅(qū)動IO與BIO和NIO最大的區(qū)別就在于,在IO執(zhí)行的數(shù)據(jù)準備階段,不會阻塞用戶進程。如下圖所示:當用戶進程需要等待數(shù)據(jù)的時候,會向內(nèi)核發(fā)送一個信號,告訴內(nèi)核我要什么數(shù)據(jù),然后用戶進程就繼續(xù)做別的事情去了,而當內(nèi)核中的數(shù)據(jù)準備好之后,內(nèi)核立馬發(fā)給用戶進程一個信號,說”數(shù)據(jù)準備好了,快來查收“,用戶進程收到信號之后,立馬調(diào)用recvfrom,去查收數(shù)據(jù)。

 

要問技術多NB,請問IO模型知多少?

 

乍一看,信號驅(qū)動式I/O模型有種異步操作的感覺,但是在IO執(zhí)行的第二階段,也就是將數(shù)據(jù)從內(nèi)核空間復制到用戶空間這個階段,用戶進程還是被阻塞的。

綜上,你會發(fā)現(xiàn),不管是BIO還是NIO還是SIGIO,它們最終都會被阻塞在IO執(zhí)行的第二階段。那如果能將IO執(zhí)行的第二階段變成非阻塞,那就完美了。

7. IO 模型之異步IO(AIO)

異步IO真正實現(xiàn)了IO全流程的非阻塞。用戶進程發(fā)出系統(tǒng)調(diào)用后立即返回,內(nèi)核等待數(shù)據(jù)準備完成,然后將數(shù)據(jù)拷貝到用戶進程緩沖區(qū),然后發(fā)送信號告訴用戶進程IO操作執(zhí)行完畢(與SIGIO相比,一個是發(fā)送信號告訴用戶進程數(shù)據(jù)準備完畢,一個是IO執(zhí)行完畢)。其流程如下:

 

要問技術多NB,請問IO模型知多少?

 

所以,之所以稱為異步IO,取決于IO執(zhí)行的第二階段是否阻塞。因此前面講的BIO,NIO和SIGIO均為同步IO。

 

要問技術多NB,請問IO模型知多少?

 

8. 總結(jié)

梳理完這些IO模型后,之前一直處于懵懂狀態(tài)的阻塞,非阻塞,同步異步IO,終于算是有個概念了。同時也糾正了自己一直以來的誤解,所以一路走來,愈發(fā)覺得返璞歸真的重要性,只有如此,才能在快速更迭的技術演進中,以不變應萬變。

本文綜合多方資料寫就,難免紕漏,但只有寫下來,才能得以指正。所以,煩請各位看官不吝賜教。

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2025-02-20 14:52:02

2024-06-18 14:01:17

2024-08-06 10:07:15

2012-02-13 22:50:59

集群高可用

2010-08-16 09:15:57

2013-12-23 14:00:31

Windows 8.2Windows 8.1

2021-12-04 11:17:32

Javascript繼承編程

2025-04-14 08:50:00

Google ADK人工智能AI

2017-07-14 10:51:37

性能優(yōu)化SQL性能分析

2023-07-02 16:09:57

人工智能人臉識別

2009-05-13 17:31:06

DBAOracleIT

2012-09-10 16:38:40

Windows Ser

2018-08-31 10:53:25

MySQL存儲引擎

2020-09-08 10:56:55

Java多線程存儲器

2021-07-22 07:20:24

JS 遍歷方法前端

2019-11-08 15:11:03

Java架構(gòu)數(shù)據(jù)

2010-09-29 09:28:04

DHCP工作原理

2022-01-06 16:20:04

Java排序算法排序

2009-03-06 19:19:55

2018-12-12 15:01:22

開源存儲 軟件
點贊
收藏

51CTO技術棧公眾號