深入解剖Linux的系統(tǒng)調(diào)用
Linux系統(tǒng)調(diào)用,包含了大部分常用系統(tǒng)調(diào)用和由系統(tǒng)調(diào)用派生出的的函數(shù)。
一、 什么是系統(tǒng)調(diào)用
在Linux的世界里,我們經(jīng)常會(huì)遇到系統(tǒng)調(diào)用這一術(shù)語(yǔ),所謂系統(tǒng)調(diào)用,就是內(nèi)核提供的、功能十分強(qiáng)大的一系列的函數(shù)。這些系統(tǒng)調(diào)用是在內(nèi)核中實(shí)現(xiàn)的,再通過(guò)一定的方式把系統(tǒng)調(diào)用給用戶(hù),一般都通過(guò)門(mén)(gate)陷入(trap)實(shí)現(xiàn)。系統(tǒng)調(diào)用是用戶(hù)程序和內(nèi)核交互的接口。
二、 系統(tǒng)調(diào)用的作用
系統(tǒng)調(diào)用在Linux系統(tǒng)中發(fā)揮著巨大的作用.如果沒(méi)有系統(tǒng)調(diào)用,那么應(yīng)用程序就失去了內(nèi)核的支持。
我們?cè)诰幊虝r(shí)用到的很多函數(shù),如fork、open等這些函數(shù)最終都是在系統(tǒng)調(diào)用里實(shí)現(xiàn)的,比如說(shuō)我們有這樣一個(gè)程序:
這里我們用到了兩個(gè)函數(shù),即fork和exit,這兩函數(shù)都是glibc中的函數(shù),但是如果我們跟蹤函數(shù)的執(zhí)行過(guò)程,看看glibc對(duì)fork和exit函數(shù)的實(shí)現(xiàn)就可以發(fā)現(xiàn)在glibc的實(shí)現(xiàn)代碼里都是采用軟中斷的方式陷入到內(nèi)核中再通過(guò)系統(tǒng)調(diào)用實(shí)現(xiàn)函數(shù)的功能的。具體過(guò)程我們?cè)谙到y(tǒng)調(diào)用的實(shí)現(xiàn)過(guò)程會(huì)詳細(xì)的講到。
由此可見(jiàn),系統(tǒng)調(diào)用是用戶(hù)接口在內(nèi)核中的實(shí)現(xiàn),如果沒(méi)有系統(tǒng)調(diào)用,用戶(hù)就不能利用內(nèi)核。
三、 系統(tǒng)調(diào)用的現(xiàn)實(shí)及調(diào)用過(guò)程
詳細(xì)講述系統(tǒng)調(diào)用的之前也講一下Linux系統(tǒng)的一些保護(hù)機(jī)制。
Linux系統(tǒng)在CPU的保護(hù)模式下提供了四個(gè)特權(quán)級(jí)別,目前內(nèi)核都只用到了其中的兩個(gè)特權(quán)級(jí)別,分別為“特權(quán)級(jí)0”和“特權(quán)級(jí)3”,級(jí)別0也就是我們通常所講的內(nèi)核模式,級(jí)別3也就是我們通常所講的用戶(hù)模式。劃分這兩個(gè)級(jí)別主要是對(duì)系統(tǒng)提供保護(hù)。內(nèi)核模式可以執(zhí)行一些特權(quán)指令和進(jìn)入用戶(hù)模式,而用戶(hù)模式則不能。
這里特別提出的是,內(nèi)核模式與用戶(hù)模式分別使用自己的堆棧,當(dāng)發(fā)生模式切換的時(shí)候同時(shí)要進(jìn)行堆棧的切換。
每個(gè)進(jìn)程都有自己的地址空間(也稱(chēng)為進(jìn)程空間),進(jìn)程的地址空間也分為兩部分:用戶(hù)空間和系統(tǒng)空間,在用戶(hù)模式下只能訪(fǎng)問(wèn)進(jìn)程的用戶(hù)空間,在內(nèi)核模式下則可以訪(fǎng)問(wèn)進(jìn)程的全部地址空間,這個(gè)地址空間里的地址是一個(gè)邏輯地址,通過(guò)系統(tǒng)段面式的管理機(jī)制,訪(fǎng)問(wèn)的實(shí)際內(nèi)存要做二級(jí)地址轉(zhuǎn)換,即:邏輯地址?線(xiàn)性地址?物理地址。
系統(tǒng)調(diào)用對(duì)于內(nèi)核來(lái)說(shuō)就相當(dāng)于函數(shù),我們是關(guān)鍵問(wèn)題是從用戶(hù)模式到內(nèi)核模式的轉(zhuǎn)換、堆棧的切換以及參數(shù)的傳遞。
下面將結(jié)合內(nèi)核源代碼對(duì)這些過(guò)程進(jìn)行分析,以下分析環(huán)境為FC2,kernel 2.6.5
下面是內(nèi)核源代碼里arch/i386/kernel/entry.S的一段代碼。
#p#
以上這段代碼里定義了兩個(gè)非常重要的宏,即SAVE_ALL和RESTORE_ALL
SAVE_ALL先保存用戶(hù)模式的寄存器和堆棧信息,然后切換到內(nèi)核模式,宏__SWITCH_KERNELSPACE實(shí)現(xiàn)地址空間的轉(zhuǎn)換RESTORE_ALL的過(guò)程過(guò)SAVE_ALL的過(guò)程正好相反。
在內(nèi)核原代碼里有一個(gè)系統(tǒng)調(diào)用表:(entry.S的文件里)
在2.6.5的內(nèi)核里,有280多個(gè)系統(tǒng)調(diào)用,這些系統(tǒng)調(diào)用的名稱(chēng)全部在這個(gè)系統(tǒng)調(diào)用表里。
在這個(gè)原文件里,還有非常重要的一段。
這一段完成系統(tǒng)調(diào)用的執(zhí)行。
system_call函數(shù)根據(jù)用戶(hù)傳來(lái)的系統(tǒng)調(diào)用號(hào),在系統(tǒng)調(diào)用表里找到對(duì)應(yīng)的系統(tǒng)調(diào)用再執(zhí)行。
從glibc的函數(shù)到系統(tǒng)調(diào)用還有一個(gè)很重要的環(huán)節(jié)就是系統(tǒng)調(diào)用號(hào)。
系統(tǒng)調(diào)用號(hào)的定義在include/asm-i386/unistd.h里
每一個(gè)系統(tǒng)調(diào)用號(hào)都對(duì)應(yīng)有一個(gè)系統(tǒng)調(diào)用
接下來(lái)就是系統(tǒng)調(diào)用宏的展開(kāi)
沒(méi)有參數(shù)的系統(tǒng)調(diào)用的宏展開(kāi)
?。。?!代碼6::
帶一個(gè)參數(shù)的系統(tǒng)調(diào)用的宏展開(kāi)
?。。?!代碼7::
兩個(gè)參數(shù)
代碼8::
#define _syscall2(type,name,type1,arg1,type2,arg2) \
三個(gè)參數(shù)的
代碼9::
#define _syscall3(type,name,type1,arg1,type2,arg2,type3,arg3) \
四個(gè)參數(shù)的
代碼10::
#define _syscall4(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4) \
五個(gè)參數(shù)的
代碼11::
#define _syscall5(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4, \
type5,arg5) \
六個(gè)參數(shù)的
代碼12::
#define _syscall6(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4, \
type5,arg5,type6,arg6) \
_res); \
從這段代碼我們可以看出int $0x80通過(guò)軟中斷開(kāi)觸發(fā)系統(tǒng)調(diào)用,當(dāng)發(fā)生調(diào)用時(shí),函數(shù)中的name會(huì)被系統(tǒng)系統(tǒng)調(diào)用名所代替。然后調(diào)用前面所講的system_call。這個(gè)過(guò)程里包含了系統(tǒng)調(diào)用的初始化,系統(tǒng)調(diào)用的初始化原代碼在:
arch/i386/kernel/traps.c中每當(dāng)用戶(hù)執(zhí)行int 0x80時(shí),系統(tǒng)進(jìn)行中斷處理,把控制權(quán)交給內(nèi)核的system_call。
整個(gè)系統(tǒng)調(diào)用的過(guò)程可以總結(jié)如下:
1. 執(zhí)行用戶(hù)程序(如:fork)
2. 根據(jù)glibc中的函數(shù)實(shí)現(xiàn),取得系統(tǒng)調(diào)用號(hào)并執(zhí)行int $0x80產(chǎn)生中斷。
3. 進(jìn)行地址空間的轉(zhuǎn)換和堆棧的切換,執(zhí)行SAVE_ALL。(進(jìn)?心諍四J劍?
4. 進(jìn)行中斷處理,根據(jù)系統(tǒng)調(diào)用表調(diào)用內(nèi)核函數(shù)。
5. 執(zhí)行內(nèi)核函數(shù)。
6. 執(zhí)行RESTORE_ALL并返回用戶(hù)模式
解了系統(tǒng)調(diào)用的實(shí)現(xiàn)及調(diào)用過(guò)程,我們可以根據(jù)自己的需要來(lái)對(duì)內(nèi)核的系統(tǒng)調(diào)用作修改或添加。希望上文都大家能有所幫助。
【編輯推薦】
- linux shell攻略上篇
- linux shell攻略下篇
- 如何學(xué)好Linux 十一大建議
- Linux就這樣被黑客入侵
- 4.23 strace:跟蹤一個(gè)進(jìn)程的系統(tǒng)調(diào)用或信號(hào)產(chǎn)生的情況
- 詳細(xì)講解Unix系統(tǒng)調(diào)用
- 5.1.1 系統(tǒng)調(diào)用、POSIX、C庫(kù)、系統(tǒng)命令和內(nèi)核函數(shù)