關(guān)于C語言結(jié)構(gòu)體偏移的一點(diǎn)思考
前言
相信大家在c語言程序開發(fā)的過程一定都使用過結(jié)構(gòu)體,那么不知你對(duì)結(jié)構(gòu)體中成員變量偏移這塊是如何理解的?本文將和大家一起分享下,本人最近關(guān)于c語言中結(jié)構(gòu)體偏移的一些思考和總結(jié)。
另外這篇博文還可以幫你更好的理解這個(gè)問題c語言中兩種宏定義的區(qū)別,關(guān)于這個(gè)思考有哪些方面的意義,細(xì)心的你可能發(fā)現(xiàn)本文所屬的類別為linux內(nèi)核源碼分析,而并非 GNU C語言編程,可能有些同學(xué)會(huì)有些許好奇。不過不用著急,如果對(duì)本篇博文意義感興趣的同學(xué),可繼續(xù)關(guān)注后續(xù)的博文,會(huì)有進(jìn)一步的闡述。
示例1
我們先來定義一下需求:
已知結(jié)構(gòu)體類型定義如下:
- struct node_t{
- char a;
- int b;
- int c;
- };
且結(jié)構(gòu)體1Byte對(duì)齊
- #pragma pack(1)
求:
結(jié)構(gòu)體struct node_t中成員變量c的偏移。
注:這里的偏移量指的是相對(duì)于結(jié)構(gòu)體起始位置的偏移量。
看到這個(gè)問題的時(shí)候,我相信不同的人腦中浮現(xiàn)的解決方法可能會(huì)有所差異,下面我們分析以下幾種可能的解法:
方法1
如果你對(duì)c語言的庫函數(shù)比較熟悉的話,那么你第一個(gè)想到的肯定是offsetof函數(shù)(其實(shí)只是個(gè)宏而已,先姑且這樣叫著吧),我們man 3 offsetof查看函數(shù)原型如下:
- #include <stddef.h>
- size_t offsetof(type, member);
有了上述的庫函數(shù),我們用一行代碼就可以搞定:
- offsetof(struct node_t, c);
當(dāng)然這并非本文探討的重點(diǎn),請(qǐng)繼續(xù)閱讀。
方法2
當(dāng)我們對(duì)c語言的庫函數(shù)不熟悉的時(shí)候,此時(shí)也不要著急,我們依然可以使用我們自己的方法來解決問題。
最直接的思路是:結(jié)構(gòu)體成員變量c的地址 - 結(jié)構(gòu)體起始地址
我們先來定義一個(gè)結(jié)構(gòu)體變量node:
- struct node_t node;
接著來計(jì)算成員變量c的偏移量:
- (unsigned long)(&(node.c)) - (unsigned long)(&node)
&(node.c)為結(jié)構(gòu)體成員變量c的地址,并強(qiáng)制轉(zhuǎn)化為unsigned long;
&node為結(jié)構(gòu)體的起始地址,也強(qiáng)制轉(zhuǎn)化為unsigned long;
最后我們將上述兩值相減,得到成員變量c的偏移量;
方法3
按照方法2的思路我們?cè)诓唤柚鷰旌瘮?shù)的情況下,依然可以得到成員變量c的偏移量。但作為程序員,我們應(yīng)該善于思考,是不是可以針對(duì)上面的代碼做一些改進(jìn),使我們的代碼變得更簡(jiǎn)潔一些?在做具體的改進(jìn)之前,我們應(yīng)該分析方法2存在哪些方面的問題。
相信不用我多說,細(xì)心的你一定已經(jīng)察覺到,方法2中最主要的一個(gè)問題是我們自定義了一個(gè)結(jié)構(gòu)體變量node,雖然題目中并未限制我們可以自定義變量,但當(dāng)我們遇到比較嚴(yán)且題目中不允許自定義變量的時(shí)候,此時(shí)我們就要思考新的解決方法。
在探討新的解決方法之前,我們先來探討一個(gè)有關(guān)偏移的小問題:
小問題
這是一道簡(jiǎn)單的幾何問題,假設(shè)在座標(biāo)軸上由A點(diǎn)移動(dòng)到B點(diǎn),如何計(jì)算B相對(duì)于A的偏移?這個(gè)問題對(duì)于我們來說是非常的簡(jiǎn)單,可能大部分人都會(huì)脫口而出并得到答案為B-A。
那么這個(gè)答案是否完全準(zhǔn)確呢?比較嚴(yán)謹(jǐn)?shù)哪阌X得顯然不是,原因在于,當(dāng)A為坐標(biāo)原點(diǎn)即A=0的時(shí)候,上述答案B-A就直接簡(jiǎn)化為B了。
這個(gè)小小的簡(jiǎn)單的問題,對(duì)于我們來說有什么啟示呢?
我們結(jié)合方法2的思路和上述的小問題,是不是很快就得到了下面的關(guān)聯(lián):
- (unsigned long)(&(node.c)) - (unsigned long)(&node)
和
- B - A
我們小問題的思路是當(dāng)A為坐標(biāo)原點(diǎn)的時(shí)候,B-A就簡(jiǎn)化為B了,那么對(duì)應(yīng)到我們的方法2,當(dāng)node的內(nèi)存地址為0即(&node==0)的時(shí)候,上面的代碼可簡(jiǎn)化為:
- (unsigned long)(&(node.c))
由于node內(nèi)存地址==0了,所以
- node.c //結(jié)構(gòu)體node中成員變量c
我們就可以使用另外一種方式來表達(dá)了,如下:
- ((struct node_t *)0)->c
上述代碼應(yīng)該比較好理解,由于我們知道結(jié)構(gòu)體的內(nèi)存地址編號(hào)為0,所以我們就可以直接通過內(nèi)存地址的方式來訪問該結(jié)構(gòu)體的成員變量,相應(yīng)的代碼的含義就是 獲取內(nèi)存地址編號(hào)為0的結(jié)構(gòu)體struct node_t的成員變量c。
此時(shí),我們的偏移求法就消除了struct node_t node這個(gè)自定義變量,直接一行代碼解決,:
- (unsigned long)(&(((struct node_t *)0)->c))
上述的代碼相對(duì)于方法2是不是更簡(jiǎn)潔了一些。
這里我們將上面的代碼功能定義為一個(gè)宏,該宏的作用是用來計(jì)算某結(jié)構(gòu)體內(nèi)成員變量的偏移(后面的示例會(huì)使用該宏):
- #define OFFSET_OF(type, member) (unsigned long)(&(((type *)0)->member))
使用上面的宏,就可以直接得到成員變量c在結(jié)構(gòu)體struct node_t中的偏移為:
- OFFSET_OF(struct node_t, c)
示例2
和示例1一樣,我們先定義需求如下:
已知結(jié)構(gòu)體類型定義如下:
- struct node_t{
- char a;
- int b;
- int c;
- };
int *p_c,該指針指向struct node_t x的成員變量c
結(jié)構(gòu)體1Byte對(duì)齊
- #pragma pack(1)
求:
結(jié)構(gòu)體x的成員變量b的值?
拿到這個(gè)問題的時(shí)候,我們先做一下簡(jiǎn)單的分析,題目的意思是根據(jù)一個(gè)指向某結(jié)構(gòu)體成員變量的指針,如何求該結(jié)構(gòu)體的另外一個(gè)成員變量的值。
那么可能的幾種解法有:
方法1
由于我們知道結(jié)構(gòu)體是1Byte對(duì)齊的,所以這道題最簡(jiǎn)單的解法是:
- *(int *)((unsigned long)p_c - sizeof(int))
上述代碼很簡(jiǎn)單,成員變量c的地址減去sizeof(int)從而得到成員變量b的地址,然后再強(qiáng)制轉(zhuǎn)換為int *,最后再取值最終得到成員變量b的值;
方法2
方法1的代碼雖然簡(jiǎn)單,但擴(kuò)展性不夠好。我們希望通過p_c直接得到指向該結(jié)構(gòu)體的指針p_node,然后通過p_node訪問該結(jié)構(gòu)體的任意成員變量了。
由此我們得到計(jì)算結(jié)構(gòu)體起始地址p_node的思路為:
(成員變量c的地址p_c)減去(c在結(jié)構(gòu)體中的偏移)
由示例1,我們得到結(jié)構(gòu)體struct node_t中成員變量c的偏移為:
- (unsigned long)&(((struct node_t *)0)->c)
所以我們得到結(jié)構(gòu)體的起始地址指針p_node為:
- (struct node_t *)((unsigned long)p_c - (unsigned long)(&((struct node_t *)0)->c))
我們也可以直接使用示例1中定義的OFFSET_OF宏,則上面的代碼變?yōu)椋?/p>
- (struct node_t *)((unsigned long)p_c - OFFSET_OF(struct node_t, c))
最后我們就可以使用下面的代碼來獲取成員變量a,b的值:
- p_node->a
- p_node->b
我們同樣將上述代碼的功能定義為如下宏:
- #define STRUCT_ENTRY(ptr, type, member) (type *)((unsigned long)(ptr)-OFFSET_OF(type, member))
該宏的功能是通過結(jié)構(gòu)體任意成員變量的指針來獲得指向該結(jié)構(gòu)體的指針。
我們使用上面的宏來修改之前的代碼如下:
- STRUCT_ENTRY(p_c, struct node_t, c)
- p_c為指向結(jié)構(gòu)體struct node_t成員變量c的指針;
- struct node_t結(jié)構(gòu)體類型;
- c為p_c指向的成員變量;
注:
上述關(guān)于地址運(yùn)算的一些說明:
- int a = 10;
- int * p_a = &a;
結(jié)論
本文通過幾個(gè)示例描述了c語言結(jié)構(gòu)體有關(guān)偏移的一些有意思的事情,希望能夠?qū)δ阌兴鶐椭?。為什么?huì)有上述思考,相信有些同學(xué)已經(jīng)看出一些端倪,這也正是后續(xù)博文將要描述的主題。
設(shè)p_a == 0x95734104;
以下為編譯器計(jì)算的相關(guān)結(jié)果:
p_a + 10 == p_a + sizeof(int)*10 =0x95734104 + 4*10 = 0x95734144
(unsigned long)p_a + 10 == 0x95734104+10 = 0x95734114
(char *)p_a + 10 == 0x95734104 + sizeof(char)*10 = 0x95734114
從上述三種情況,相信你應(yīng)該能體會(huì)到我所要表達(dá)的意思了。