Linux內核中常用的C語言技巧
Linux內核采用的是GCC編譯器,GCC編譯器除了支持ANSI C,還支持GNU C。在Linux內核中,許多地方都使用了GNU C語言的擴展特性,如typeof、__attribute__、__aligned、__builtin_等,這些都是GNU C語言的特性。
typeof
下面是比較兩個數大小返回最大值的經典宏寫法:
如果a傳入i++,b傳入j++,那么這個比較大小就會出錯。例如:
輸出結果:max=3,x=2,y=4。這是錯誤的結果,正常我們希望的是max(1,2),返回max=2。如何修改這個宏呢?
在GNU C語言中,如果知道a和b的類型,可以在宏里面定義一個變量,將a, b賦值給變量,然后再比較。例如:
如果不知道具體的數據類型,可以使用typeof類轉換宏,Linux內核中的例子:
typeof(a) _a = (a):定義一個a類型的變量_a,將a賦值給_a
typeof(b) _b = (b):定義一個b類型的變量_b,將b賦值給_b
(void) (&_a == &_b):判斷兩個數的類型是否相同,如果不相同,會拋出一個警告。因為a和b的類型不一樣,其指針類型也會不一樣,兩個不一樣的指針類型進行比較操作,會拋出一個編譯警告。
typeof用法舉例:
零長數組
零長數組,又叫柔性數組。而它的作用主要就是為了滿足需要變長度的結構體,因此有時也習慣性地稱為變長數組。
用法:在一個結構體的最后, 申明一個長度為0的數組, 就可以使得這個結構體是可變長的。
對于編譯器來說, 此時長度為0的數組并不占用空間, 因為數組名本身不占空間, 它只是一個偏移量, 數組名這個符號本身代表了一個不可修改的地址常量
結構體中定義零長數組:
數據結構最后一個元素被定義為零長度數組,不占結構體空間。這樣,我們可以根據對象大小動態(tài)地分配結構的大小。
如上例所示,struct line數據結構定義了一個int length變量和一個變長數組contents[0],這個struct line數據結構的大小只包含int類型的大小,不包含contents的大小,也就是**sizeof (struct line) = sizeof (int)**。
創(chuàng)建結構體對象時,可根據實際的需要指定這個可變長數組的長度,并分配相應的空間,如上述實例代碼分配了this_length 字節(jié)的內存,并且可以通過contents[index]來訪問第index個地址的數據。
case范圍
GNU C語言支持指定一個case的范圍作為一個標簽,如:
這里low到high表示一個區(qū)間范圍,在ASCII字符代碼中也非常有用。下面是Linux內核中的代碼例子。
另外,還可以用整形數來表示范圍,但是這里需要注意在“...”兩邊有空格,否則編譯會出錯。
標號元素
GNU C語言可以通過指定索引或結構體成員名來初始化,不必按照原來的固定順序進行初始化。
結構體成員的初始化在 Linux 內核中經常使用,如在設備驅動中初始化file_operations數據結構:
如上述代碼中的zero_fops的成員llseek初始化為zero_lseek函數,read成員初始化為new_sync_read函數,依次類推。當file_operations數據結構的定義發(fā)生變化時,這種初始化方法依然能保證已知元素的正確性,對于未初始化成員的值為0或者NULL。
可變參數宏
在GNU C語言中,宏可以接受可變數目的參數,主要用在輸出函數里。例如:
“...”代表一個可以變化的參數表,“__VA_ARGS__”是編譯器保留字段,預處理時把參數傳遞給宏。當宏的調用展開時,實際參數就傳遞給dynamic_pr_debug函數了。
函數屬性
GNU C語言允許聲明函數屬性(Function Attribute)、變量屬性(Variable Attribute)和類型屬性(Type Attribute),以便編譯器進行特定方面的優(yōu)化和更仔細的代碼檢查。特殊屬性語法格式為:
attribute-list?的定義有很多,如noreturn?、format?以及const?等。此外,還可以定義一些和處理器體系結構相關的函數屬性,如ARM體系結構中可以定義interrupt?、isr等屬性。
下面是Linux內核中使用format屬性的一個例子。
libcfs_debug_msg()函數里聲明了一個format函數屬性,它會告訴編譯器按照printf的參數表的格式規(guī)則對該函數參數進行檢查。數字2表示第二個參數為格式化字符串,數字3表示參數“...”里的第一個參數在函數參數總數中排在第幾個。
noreturn屬性告訴編譯器,該函數從不返回值,這可以消除一些不必要的警告信息。例如以下函數,函數不會返回:
const 屬性會讓編譯器只調用該函數一次,以后再調用時只需要返回第一次結果即可,從而提高效率。
Linux還有一些其他的函數屬性,被定義在compiler-gcc.h文件中。
變量屬性和類型屬性
變量屬性可以對變量或結構體成員進行屬性設置。類型屬性常見的屬性有alignment?、packed?和sections等。
alignment屬性規(guī)定變量或者結構體成員的最小對齊格式,以字節(jié)為單位。
在這個例子中,編譯器以8字節(jié)對齊的方式來分配qib_user_info這個數據結構。
packed屬性可以使變量或者結構體成員使用最小的對齊方式,對變量是以字節(jié)對齊,對域是以位對齊。
x成員使用了packed屬性,它會存儲在變量a后面,所以這個結構體一共占用9字節(jié)。
內建函數
內建函數以“_builtin_”作為函數名前綴。下面介紹Linux內核常用的一些內建函數。
__builtin_constant_p(x):判斷x是否在編譯時就可以被確定為常量。如果x為常量,該函數返回1,否則返回0。
__builtin_expect(exp, c):
__builtin_expect(exp, c):這里的意思是exp==c的概率很大,用來引導GCC編譯器進行條件分支預測。開發(fā)人員知道最可能執(zhí)行哪個分支,并將最有可能執(zhí)行的分支告訴編譯器,讓編譯器優(yōu)化指令序列,使指令盡可能地順序執(zhí)行,從而提高CPU預取指令的正確率。
Linux內核中經常見到likely()?和unlikely()?函數,本質也是__builtin_expect():
__builtin_prefetch(const void *addr, int rw, int locality):主動進行數據預取,在使用地址addr的值之前就把其值加載到cache中,減少讀取的延遲,從而提高性能。
該函數可以接受3個參數:
- 第一個參數addr表示要預取數據的地址;
- 第二個參數rw表示讀寫屬性,1表示可寫,0表示只讀;
- 第三個參數locality?表示數據在cache中的時間局部性,其中0表示讀取完addr的之后不用保留在cache中,而1~3表示時間局部性逐漸增強。如下面的prefetch()?和prefetchw()函數的實現(xiàn)。
下面是使用prefetch()函數進行優(yōu)化的一個例子。
在處理struct page數據之前,通過prefetchw()預取到cache中,從而提升性能。
asmlinkage
在標準C語言中,函數的形參在實際傳入參數時會涉及參數存放問題。
對于x86架構,函數參數和局部變量被一起分配到函數的局部堆棧里。x86中對asmlinkage的定義:
attribute((regparm(0))):告訴編譯器該函數不需要通過任何寄存器來傳遞參數,只通過堆棧來傳遞。
對于ARM?來說,函數參數的傳遞有一套ATPCS標準,即通過寄存器來傳遞。ARM中的R0~R4寄存器存放傳入參數,當參數超過5個時,多余的參數被存放在局部堆棧中。所以,ARM平臺沒有定義asmlinkage。
UL
在Linux內核代碼中,我們經常會看到一些數字的定義使用了UL后綴修飾。
數字常量會被隱形定義為int類型,兩個int類型相加的結果可能會發(fā)生溢出。
因此使用UL強制把int?類型數據轉換為unsigned long?類型,這是為了保證運算過程不會因為int的位數不同而導致溢出。
1 :表示有符號整型數字1
UL:表示無符號長整型數字1