C語(yǔ)言結(jié)構(gòu)體里的成員數(shù)組和指針
單看這文章的標(biāo)題,你可能會(huì)覺(jué)得好像沒(méi)什么意思。你先別下這個(gè)結(jié)論,相信這篇文章會(huì)對(duì)你理解C語(yǔ)言有幫助。這篇文章產(chǎn)生的背景是在微博上,看到@Laruence同學(xué)出了一個(gè)關(guān)于C語(yǔ)言的題,微博鏈接。微博截圖如下。我覺(jué)得好多人對(duì)這段代碼的理解還不夠深入,所以寫下了這篇文章。
為了方便你把代碼copy過(guò)去編譯和調(diào)試,我把代碼列在下面:
- #include <stdio.h>
- struct str{
- int len;
- char s[0];
- };
- struct foo {
- struct str *a;
- };
- int main(int argc, char** argv) {
- struct foo f={0};
- if (f.a->s) {
- printf( f.a->s);
- }
- return 0;
- }
你編譯一下上面的代碼,在VC++和GCC下都會(huì)在14行的printf處crash掉你的程序。@Laruence 說(shuō)這個(gè)是個(gè)經(jīng)典的坑,我覺(jué)得這怎么會(huì)是經(jīng)典的坑呢?上面這代碼,你一定會(huì)問(wèn),為什么if語(yǔ)句判斷的不是f.a?而是f.a里面的數(shù)組?寫這樣代碼的人腦子里在想什么?還是用這樣的代碼來(lái)玩票?不管怎么樣,我個(gè)人覺(jué)得這主要還是對(duì)C語(yǔ)言理解不深,如果這算坑的話,那么全都是坑。
接下來(lái),你調(diào)試一下,或是你把14行的printf語(yǔ)句改成:
- printf("%x\n", f.a->s);
你會(huì)看到程序不crash了。程序輸出:4。 這下你知道了,訪問(wèn)0×4的內(nèi)存地址,不crash才怪。于是,你一定會(huì)有如下的問(wèn)題:
1)為什么不是 13行if語(yǔ)句出錯(cuò)?f.a被初始化為空了嘛,用空指針訪問(wèn)成員變量為什么不crash?
2)為什么會(huì)訪問(wèn)到了0×4的地址?靠,4是怎么出來(lái)的?
3)代碼中的第4行,char s[0] 是個(gè)什么東西?零長(zhǎng)度的數(shù)組?為什么要這樣玩?
讓我們從基礎(chǔ)開(kāi)始一點(diǎn)一點(diǎn)地來(lái)解釋C語(yǔ)言中這些詭異的問(wèn)題。
結(jié)構(gòu)體中的成員
首先,我們需要知道——所謂變量,其實(shí)是內(nèi)存地址的一個(gè)抽像名字罷了。在靜態(tài)編譯的程序中,所有的變量名都會(huì)在編譯時(shí)被轉(zhuǎn)成內(nèi)存地址。機(jī)器是不知道我們?nèi)〉拿值?,只知道地址?/p>
所以有了——棧內(nèi)存區(qū),堆內(nèi)存區(qū),靜態(tài)內(nèi)存區(qū),常量?jī)?nèi)存區(qū),我們代碼中的所有變量都會(huì)被編譯器預(yù)先放到這些內(nèi)存區(qū)中。
有了上面這個(gè)基礎(chǔ),我們來(lái)看一下結(jié)構(gòu)體中的成員的地址是什么?我們先簡(jiǎn)單化一下代碼:
- struct test{
- int i;
- char *p;
- };
上面代碼中,test結(jié)構(gòu)中i和p指針,在C的編譯器中保存的是相對(duì)地址——也就是說(shuō),他們的地址是相對(duì)于struct test的實(shí)例的。如果我們有這樣的代碼:
- struct test t;
我們用gdb跟進(jìn)去,對(duì)于實(shí)例t,我們可以看到:
- # t實(shí)例中的p就是一個(gè)野指針
- (gdb) p t
- $1 = {i = 0, c = 0 '\000', d = 0 '\000', p = 0x4003e0 "1\355I\211\..."}
- # 輸出t的地址
- (gdb) p &t
- $2 = (struct test *) 0x7fffffffe5f0
- #輸出(t.i)的地址
- (gdb) p &(t.i)
- $3 = (char **) 0x7fffffffe5f0
- #輸出(t.p)的地址
- (gdb) p &(t.p)
- $4 = (char **) 0x7fffffffe5f4
我們可以看到,t.i的地址和t的地址是一樣的,t.p的址址相對(duì)于t的地址多了個(gè)4。說(shuō)白了,t.i 其實(shí)就是(&t + 0×0), t.p 的其實(shí)就是 (&t + 0×4)。0×0和0×4這個(gè)偏移地址就是成員i和p在編譯時(shí)就被編譯器給hard code了的地址。于是,你就知道,不管結(jié)構(gòu)體的實(shí)例是什么——訪問(wèn)其成員其實(shí)就是加成員的偏移量。
下面我們來(lái)做個(gè)實(shí)驗(yàn):
- struct test{
- int i;
- short c;
- char *p;
- };
- int main(){
- struct test *pt=NULL;
- return 0;
- }
編譯后,我們用gdb調(diào)試一下,當(dāng)初始化pt后,我們看看如下的調(diào)試:(我們可以看到就算是pt為NULL,訪問(wèn)其中的成員時(shí),其實(shí)就是在訪問(wèn)相對(duì)于pt的內(nèi)址)
- (gdb) p pt
- $1 = (struct test *) 0x0
- (gdb) p pt->i
- Cannot access memory at address 0x0
- (gdb) p pt->c
- Cannot access memory at address 0x4
- (gdb) p pt->p
- Cannot access memory at address 0x8
注意:上面的pt->p的偏移之所以是0×8而不是0×6,是因?yàn)閮?nèi)存對(duì)齊了(我在64位系統(tǒng)上)。關(guān)于內(nèi)存對(duì)齊,可參看《深入理解C語(yǔ)言》一文。
好了,現(xiàn)在你知道為什么原題中會(huì)訪問(wèn)到了0×4的地址了吧,因?yàn)槭窍鄬?duì)地址。
相對(duì)地址有很好多處,其可以玩出一些有意思的編程技巧,比如把C搞出面向?qū)ο笫降母杏X(jué)來(lái),你可以參看我正好11年前的文章《用C寫面向?qū)ο竦某绦?/a>》(用指針類型強(qiáng)轉(zhuǎn)的危險(xiǎn)玩法——相對(duì)于C++來(lái)說(shuō),C++編譯器幫你管了繼承和虛函數(shù)表,語(yǔ)義也清楚了很多)
指針和數(shù)組的差別
有了上面的基礎(chǔ)后,你把源代碼中的struct str結(jié)構(gòu)體中的char s[0];改成char *s;試試看,你會(huì)發(fā)現(xiàn),在13行if條件的時(shí)候,程序因?yàn)镃annot access memory就直接掛掉了。為什么聲明成char s[0],程序會(huì)在14行掛掉,而聲明成char *s,程序會(huì)在13行掛掉呢?那么char *s 和 char s[0]有什么差別呢?
在說(shuō)明這個(gè)事之前,有必要看一下匯編代碼,用GDB查看后發(fā)現(xiàn):
- 對(duì)于char s[0]來(lái)說(shuō),匯編代碼用了lea指令,lea 0×04(%rax), %rdx
- 對(duì)于char*s來(lái)說(shuō),匯編代碼用了mov指令,mov 0×04(%rax), %rdx
lea全稱load effective address,是把地址放進(jìn)去,而mov則是把地址里的內(nèi)容放進(jìn)去。所以,就crash了。
從這里,我們可以看到,訪問(wèn)成員數(shù)組名其實(shí)得到的是數(shù)組的相對(duì)地址,而訪問(wèn)成員指針其實(shí)是相對(duì)地址里的內(nèi)容(這和訪問(wèn)其它非指針或數(shù)組的變量是一樣的)
換句話說(shuō),對(duì)于數(shù)組 char s[10]來(lái)說(shuō),數(shù)組名 s 和 &s 都是一樣的(不信你可以自己寫個(gè)程序試試)。在我們這個(gè)例子中,也就是說(shuō),都表示了偏移后的地址。這樣,如果我們?cè)L問(wèn) 指針的地址(或是成員變量的地址),那么也就不會(huì)讓程序掛掉了。
正如下面的代碼,可以運(yùn)行一點(diǎn)也不會(huì)crash掉(你匯編一下你會(huì)看到用的都是lea指令):
- struct test{
- int i;
- short c;
- char *p;
- char s[10];
- };
- int main(){
- struct test *pt=NULL;
- printf("&s = %x\n", pt->s); //等價(jià)于 printf("%x\n", &(pt->s) );
- printf("&i = %x\n", &pt->i); //因?yàn)椴僮鞣麅?yōu)先級(jí),我沒(méi)有寫成&(pt->i)
- printf("&c = %x\n", &pt->c);
- printf("&p = %x\n", &pt->p);
- return 0;
- }
看到這里,你覺(jué)得這能算坑嗎?不要出什么事都去怪語(yǔ)言,想想是不是問(wèn)題出在自己身上。
#p#
關(guān)于零長(zhǎng)度的數(shù)組
首先,我們要知道,0長(zhǎng)度的數(shù)組在ISO C和C++的規(guī)格說(shuō)明書(shū)中是不允許的。這也就是為什么在VC++2012下編譯你會(huì)得到一個(gè)警告:“arning C4200: 使用了非標(biāo)準(zhǔn)擴(kuò)展 : 結(jié)構(gòu)/聯(lián)合中的零大小數(shù)組”。
那么為什么gcc可以通過(guò)而連一個(gè)警告都沒(méi)有?那是因?yàn)間cc 為了預(yù)先支持C99的這種玩法,所以,讓“零長(zhǎng)度數(shù)組”這種玩法合法了。關(guān)于GCC對(duì)于這個(gè)事的文檔在這里:“Arrays of Length Zero”,文檔中給了一個(gè)例子(我改了一下,改成可以運(yùn)行的了):
- #include <stdlib.h>
- #include <string.h>
- struct line {
- int length;
- char contents[0]; // C99的玩法是:char contents[]; 沒(méi)有指定數(shù)組長(zhǎng)度
- };
- int main(){
- int this_length=10;
- struct line *thisline = (struct line *)
- malloc (sizeof (struct line) + this_length);
- thisline->length = this_length;
- memset(thisline->contents, 'a', this_length);
- return 0;
- }
看到這里,你覺(jué)得這能算坑嗎?不要出什么事都去怪語(yǔ)言,想想是不是問(wèn)題出在自己身上。
關(guān)于零長(zhǎng)度的數(shù)組
首先,我們要知道,0長(zhǎng)度的數(shù)組在ISO C和C++的規(guī)格說(shuō)明書(shū)中是不允許的。這也就是為什么在VC++2012下編譯你會(huì)得到一個(gè)警告:“arning C4200: 使用了非標(biāo)準(zhǔn)擴(kuò)展 : 結(jié)構(gòu)/聯(lián)合中的零大小數(shù)組”。
那么為什么gcc可以通過(guò)而連一個(gè)警告都沒(méi)有?那是因?yàn)間cc 為了預(yù)先支持C99的這種玩法,所以,讓“零長(zhǎng)度數(shù)組”這種玩法合法了。關(guān)于GCC對(duì)于這個(gè)事的文檔在這里:“Arrays of Length Zero”,文檔中給了一個(gè)例子(我改了一下,改成可以運(yùn)行的了):
- #include <stdlib.h>
- #include <string.h>
- struct line {
- int length;
- char contents[0]; // C99的玩法是:char contents[]; 沒(méi)有指定數(shù)組長(zhǎng)度
- };
- int main(){
- int this_length=10;
- struct line *thisline = (struct line *)
- malloc (sizeof (struct line) + this_length);
- thisline->length = this_length;
- memset(thisline->contents, 'a', this_length);
- return 0;
- }
上面這段代碼的意思是:我想分配一個(gè)不定長(zhǎng)的數(shù)組,于是我有一個(gè)結(jié)構(gòu)體,其中有兩個(gè)成員,一個(gè)是length,代表數(shù)組的長(zhǎng)度,一個(gè)是contents,代碼數(shù)組的內(nèi)容。后面代碼里的 this_length(長(zhǎng)度是10)代表是我想分配的數(shù)據(jù)的長(zhǎng)度。(這看上去是不是像一個(gè)C++的類?)這種玩法英文叫:Flexible Array,中文翻譯叫:柔性數(shù)組。
我們來(lái)用gdb看一下:
- (gdb) p thisline
- $1 = (struct line *) 0x601010
- (gdb) p *thisline
- $2 = {length = 10, contents = 0x601010 "\n"}
- (gdb) p thisline->contents
- $3 = 0x601014 "aaaaaaaaaa"
我們可以看到:在輸出*thisline時(shí),我們發(fā)現(xiàn)其中的成員變量contents的地址居然和thisline是一樣的(偏移量為0×0??!!)。但是當(dāng)我們輸出thisline->contents的時(shí)候,你又發(fā)現(xiàn)contents的地址是被offset了0×4了的,內(nèi)容也變成了10個(gè)‘a’。(我覺(jué)得這是一個(gè)GDB的bug,VC++的調(diào)試器就能很好的顯示)
我們繼續(xù),如果你sizeof(char[0])或是 sizeof(int[0]) 之類的零長(zhǎng)度數(shù)組,你會(huì)發(fā)現(xiàn)sizeof返回了0,這就是說(shuō),零長(zhǎng)度的數(shù)組是存在于結(jié)構(gòu)體內(nèi)的,但是不占結(jié)構(gòu)體的size。你可以簡(jiǎn)單的理解為一個(gè)沒(méi)有內(nèi)容的占位標(biāo)識(shí),直到我們給結(jié)構(gòu)體分配了內(nèi)存,這個(gè)占位標(biāo)識(shí)才變成了一個(gè)有長(zhǎng)度的數(shù)組。
看到這里,你會(huì)說(shuō),為什么要這樣搞啊,把contents聲明成一個(gè)指針,然后為它再分配一下內(nèi)存不行么?就像下面一樣。
- struct line {
- int length;
- char *contents;
- };
- int main(){
- int this_length=10;
- struct line *thisline = (struct line *)malloc (sizeof (struct line));
- thisline->contents = (char*) malloc( sizeof(char) * this_length );
- thisline->length = this_length;
- memset(thisline->contents, 'a', this_length);
- return 0;
- }
這不一樣清楚嗎?而且也沒(méi)什么怪異難懂的東西。是的,這也是普遍的編程方式,代碼是很清晰,也讓人很容易理解。即然這樣,那為什么要搞一個(gè)零長(zhǎng)度的數(shù)組?有毛意義?!
這個(gè)事情出來(lái)的原因是——我們想給一個(gè)結(jié)構(gòu)體內(nèi)的數(shù)據(jù)分配一個(gè)連續(xù)的內(nèi)存!這樣做的意義有兩個(gè)好處:
第一個(gè)意義是,方便內(nèi)存釋放。如果我們的代碼是在一個(gè)給別人用的函數(shù)中,你在里面做了二次內(nèi)存分配,并把整個(gè)結(jié)構(gòu)體返回給用戶。用戶調(diào)用free可以釋放結(jié)構(gòu)體,但是用戶并不知道這個(gè)結(jié)構(gòu)體內(nèi)的成員也需要free,所以你不能指望用戶來(lái)發(fā)現(xiàn)這個(gè)事。所以,如果我們把結(jié)構(gòu)體的內(nèi)存以及其成員要的內(nèi)存一次性分配好了,并返回給用戶一個(gè)結(jié)構(gòu)體指針,用戶做一次free就可以把所有的內(nèi)存也給釋放掉。(讀到這里,你一定會(huì)覺(jué)得C++的封閉中的析構(gòu)函數(shù)會(huì)讓這事容易和干凈很多)
第二個(gè)原因是,這樣有利于訪問(wèn)速度。連續(xù)的內(nèi)存有益于提高訪問(wèn)速度,也有益于減少內(nèi)存碎片。(其實(shí),我個(gè)人覺(jué)得也沒(méi)多高了,反正你跑不了要用做偏移量的加法來(lái)尋址)
我們來(lái)看看是怎么個(gè)連續(xù)的,用gdb的x命令來(lái)查看:(我們知道,用struct line {}中的那個(gè)char contents[]不占用結(jié)構(gòu)體的內(nèi)存,所以,struct line就只有一個(gè)int成員,4個(gè)字節(jié),而我們還要為contents[]分配10個(gè)字節(jié)長(zhǎng)度,所以,一共是14個(gè)字節(jié))
- (gdb) x /14b thisline
- 0x601010: 10 0 0 0 97 97 97 97
- 0x601018: 97 97 97 97 97 97
從上面的內(nèi)存布局我們可以看到,前4個(gè)字節(jié)是 int length,后10個(gè)字節(jié)就是char contents[]。
如果用指針的話,會(huì)變成這個(gè)樣子:
- (gdb) x /16b thisline
- 0x601010: 1 0 0 0 0 0 0 0
- 0x601018: 32 16 96 0 0 0 0 0
- (gdb) x /10b this->contents
- 0x601020: 97 97 97 97 97 97 97 97
- 0x601028: 97 97
上面一共輸出了四行內(nèi)存,其中,
- 第一行前四個(gè)字節(jié)是 int length,第一行的后四個(gè)字節(jié)是對(duì)齊。
- 第二行是char* contents,64位系統(tǒng)指針8個(gè)長(zhǎng)度,他的值是0×20 0×10 0×60 也就是0×601020。
- 第三行和第四行是char* contents指向的內(nèi)容。
從這里,我們看到,其中的差別——數(shù)組的原地就是內(nèi)容,而指針的那里保存的是內(nèi)容的地址。
后記
好了,我的文章到這里就結(jié)束了。但是,請(qǐng)?jiān)试S我再嘮叨兩句。
1)看過(guò)這篇文章,你覺(jué)得C復(fù)雜嗎?我覺(jué)得并不簡(jiǎn)單。某些地方的復(fù)雜程度不亞于C++。
2)那些學(xué)不好C++的人一定是連C都學(xué)不好的人。連C都沒(méi)學(xué)好,你們根本沒(méi)有資格鄙視C++。
3)當(dāng)你們?cè)谡f(shuō)有坑的時(shí)候,你得問(wèn)一下自己,是真有坑還是自己的學(xué)習(xí)能力上出了問(wèn)題。
如果你覺(jué)得你的C語(yǔ)言還不錯(cuò),歡迎你看看《C語(yǔ)言的謎題》還有《誰(shuí)說(shuō)C語(yǔ)言很簡(jiǎn)單?》還有《語(yǔ)言的歧義》以及《深入理解C語(yǔ)言》一文。