自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

C語(yǔ)言結(jié)構(gòu)體里的成員數(shù)組和指針

作者：陳皓 2014-04-01 10:11:33

開(kāi)發(fā) 后端開(kāi)發(fā)工具

單看這文章的標(biāo)題，你可能會(huì)覺(jué)得好像沒(méi)什么意思。你先別下這個(gè)結(jié)論，相信這篇文章會(huì)對(duì)你理解C語(yǔ)言有幫助。這篇文章產(chǎn)生的背景是在微博上，看到@Laruence同學(xué)出了一個(gè)關(guān)于C語(yǔ)言的題，微博鏈接。微博截圖如下。我覺(jué)得好多人對(duì)這段代碼的理解還不夠深入，所以寫下了這篇文章。

單看這文章的標(biāo)題，你可能會(huì)覺(jué)得好像沒(méi)什么意思。你先別下這個(gè)結(jié)論，相信這篇文章會(huì)對(duì)你理解C語(yǔ)言有幫助。這篇文章產(chǎn)生的背景是在微博上，看到@Laruence同學(xué)出了一個(gè)關(guān)于C語(yǔ)言的題，微博鏈接。微博截圖如下。我覺(jué)得好多人對(duì)這段代碼的理解還不夠深入，所以寫下了這篇文章。

為了方便你把代碼copy過(guò)去編譯和調(diào)試，我把代碼列在下面：

#include <stdio.h>   
struct str{   
    int len;   
    char s[0];   
};   
    
struct foo {   
    struct str *a;   
};   
    
int main(int argc, char** argv) {   
    struct foo f={0};   
    if (f.a->s) {   
        printf( f.a->s);   
    }   
    return 0;   
}

你編譯一下上面的代碼，在VC++和GCC下都會(huì)在14行的printf處crash掉你的程序。@Laruence 說(shuō)這個(gè)是個(gè)經(jīng)典的坑，我覺(jué)得這怎么會(huì)是經(jīng)典的坑呢？上面這代碼，你一定會(huì)問(wèn)，為什么if語(yǔ)句判斷的不是f.a？而是f.a里面的數(shù)組？寫這樣代碼的人腦子里在想什么？還是用這樣的代碼來(lái)玩票？不管怎么樣，我個(gè)人覺(jué)得這主要還是對(duì)C語(yǔ)言理解不深，如果這算坑的話，那么全都是坑。

接下來(lái)，你調(diào)試一下，或是你把14行的printf語(yǔ)句改成：

printf("%x\n", f.a->s);

你會(huì)看到程序不crash了。程序輸出：4。這下你知道了，訪問(wèn)0×4的內(nèi)存地址，不crash才怪。于是，你一定會(huì)有如下的問(wèn)題：

1）為什么不是 13行if語(yǔ)句出錯(cuò)？f.a被初始化為空了嘛，用空指針訪問(wèn)成員變量為什么不crash？

2）為什么會(huì)訪問(wèn)到了0×4的地址？靠，4是怎么出來(lái)的？

3）代碼中的第4行，char s[0] 是個(gè)什么東西？零長(zhǎng)度的數(shù)組？為什么要這樣玩？

讓我們從基礎(chǔ)開(kāi)始一點(diǎn)一點(diǎn)地來(lái)解釋C語(yǔ)言中這些詭異的問(wèn)題。

結(jié)構(gòu)體中的成員

首先，我們需要知道——所謂變量，其實(shí)是內(nèi)存地址的一個(gè)抽像名字罷了。在靜態(tài)編譯的程序中，所有的變量名都會(huì)在編譯時(shí)被轉(zhuǎn)成內(nèi)存地址。機(jī)器是不知道我們?nèi)〉拿值?，只知道地址?/p>

所以有了——棧內(nèi)存區(qū)，堆內(nèi)存區(qū)，靜態(tài)內(nèi)存區(qū)，常量?jī)?nèi)存區(qū)，我們代碼中的所有變量都會(huì)被編譯器預(yù)先放到這些內(nèi)存區(qū)中。

有了上面這個(gè)基礎(chǔ)，我們來(lái)看一下結(jié)構(gòu)體中的成員的地址是什么？我們先簡(jiǎn)單化一下代碼：

struct test{   
    int i;   
    char *p;   
};

上面代碼中，test結(jié)構(gòu)中i和p指針，在C的編譯器中保存的是相對(duì)地址——也就是說(shuō)，他們的地址是相對(duì)于struct test的實(shí)例的。如果我們有這樣的代碼：

struct test t;

我們用gdb跟進(jìn)去，對(duì)于實(shí)例t，我們可以看到：

# t實(shí)例中的p就是一個(gè)野指針   
(gdb) p t   
$1 = {i = 0, c = 0 '\000', d = 0 '\000', p = 0x4003e0 "1\355I\211\..."}   
    
# 輸出t的地址   
(gdb) p &t   
$2 = (struct test *) 0x7fffffffe5f0   
    
#輸出(t.i)的地址   
(gdb) p &(t.i)   
$3 = (char **) 0x7fffffffe5f0   
    
#輸出(t.p)的地址   
(gdb) p &(t.p)   
$4 = (char **) 0x7fffffffe5f4

我們可以看到，t.i的地址和t的地址是一樣的，t.p的址址相對(duì)于t的地址多了個(gè)4。說(shuō)白了，t.i 其實(shí)就是(&t + 0×0), t.p 的其實(shí)就是 (&t + 0×4)。0×0和0×4這個(gè)偏移地址就是成員i和p在編譯時(shí)就被編譯器給hard code了的地址。于是，你就知道，不管結(jié)構(gòu)體的實(shí)例是什么——訪問(wèn)其成員其實(shí)就是加成員的偏移量。

下面我們來(lái)做個(gè)實(shí)驗(yàn)：

struct test{   
    int i;   
    short c;   
    char *p;   
};   
    
int main(){   
    struct test *pt=NULL;   
    return 0;   
}

編譯后，我們用gdb調(diào)試一下，當(dāng)初始化pt后，我們看看如下的調(diào)試：（我們可以看到就算是pt為NULL，訪問(wèn)其中的成員時(shí)，其實(shí)就是在訪問(wèn)相對(duì)于pt的內(nèi)址）

(gdb) p pt   
$1 = (struct test *) 0x0   
(gdb) p pt->i   
Cannot access memory at address 0x0   
(gdb) p pt->c   
Cannot access memory at address 0x4   
(gdb) p pt->p   
Cannot access memory at address 0x8

注意：上面的pt->p的偏移之所以是0×8而不是0×6，是因?yàn)閮?nèi)存對(duì)齊了（我在64位系統(tǒng)上）。關(guān)于內(nèi)存對(duì)齊，可參看《深入理解C語(yǔ)言》一文。

好了，現(xiàn)在你知道為什么原題中會(huì)訪問(wèn)到了0×4的地址了吧，因?yàn)槭窍鄬?duì)地址。

相對(duì)地址有很好多處，其可以玩出一些有意思的編程技巧，比如把C搞出面向?qū)ο笫降母杏X(jué)來(lái)，你可以參看我正好11年前的文章《用C寫面向?qū)ο竦某绦?/a>》（用指針類型強(qiáng)轉(zhuǎn)的危險(xiǎn)玩法——相對(duì)于C++來(lái)說(shuō)，C++編譯器幫你管了繼承和虛函數(shù)表，語(yǔ)義也清楚了很多）

指針和數(shù)組的差別

有了上面的基礎(chǔ)后，你把源代碼中的struct str結(jié)構(gòu)體中的char s[0];改成char *s;試試看，你會(huì)發(fā)現(xiàn)，在13行if條件的時(shí)候，程序因?yàn)镃annot access memory就直接掛掉了。為什么聲明成char s[0]，程序會(huì)在14行掛掉，而聲明成char *s，程序會(huì)在13行掛掉呢？那么char *s 和 char s[0]有什么差別呢？

在說(shuō)明這個(gè)事之前，有必要看一下匯編代碼，用GDB查看后發(fā)現(xiàn)：

對(duì)于char s[0]來(lái)說(shuō)，匯編代碼用了lea指令，lea 0×04(%rax), %rdx
對(duì)于char*s來(lái)說(shuō)，匯編代碼用了mov指令，mov 0×04(%rax), %rdx

lea全稱load effective address，是把地址放進(jìn)去，而mov則是把地址里的內(nèi)容放進(jìn)去。所以，就crash了。

從這里，我們可以看到，訪問(wèn)成員數(shù)組名其實(shí)得到的是數(shù)組的相對(duì)地址，而訪問(wèn)成員指針其實(shí)是相對(duì)地址里的內(nèi)容（這和訪問(wèn)其它非指針或數(shù)組的變量是一樣的）

換句話說(shuō)，對(duì)于數(shù)組 char s[10]來(lái)說(shuō)，數(shù)組名 s 和 &s 都是一樣的（不信你可以自己寫個(gè)程序試試）。在我們這個(gè)例子中，也就是說(shuō)，都表示了偏移后的地址。這樣，如果我們?cè)L問(wèn) 指針的地址（或是成員變量的地址），那么也就不會(huì)讓程序掛掉了。

正如下面的代碼，可以運(yùn)行一點(diǎn)也不會(huì)crash掉（你匯編一下你會(huì)看到用的都是lea指令）：

struct test{   
    int i;   
    short c;   
    char *p;   
    char s[10];   
};   
    
int main(){   
    struct test *pt=NULL;   
    printf("&s = %x\n", pt->s); //等價(jià)于 printf("%x\n", &(pt->s) );   
    printf("&i = %x\n", &pt->i); //因?yàn)椴僮鞣麅?yōu)先級(jí)，我沒(méi)有寫成&(pt->i)   
    printf("&c = %x\n", &pt->c);   
    printf("&p = %x\n", &pt->p);   
    return 0;   
}

看到這里，你覺(jué)得這能算坑嗎？不要出什么事都去怪語(yǔ)言，想想是不是問(wèn)題出在自己身上。

#p#

關(guān)于零長(zhǎng)度的數(shù)組

首先，我們要知道，0長(zhǎng)度的數(shù)組在ISO C和C++的規(guī)格說(shuō)明書(shū)中是不允許的。這也就是為什么在VC++2012下編譯你會(huì)得到一個(gè)警告：“arning C4200: 使用了非標(biāo)準(zhǔn)擴(kuò)展 : 結(jié)構(gòu)/聯(lián)合中的零大小數(shù)組”。

那么為什么gcc可以通過(guò)而連一個(gè)警告都沒(méi)有？那是因?yàn)間cc 為了預(yù)先支持C99的這種玩法，所以，讓“零長(zhǎng)度數(shù)組”這種玩法合法了。關(guān)于GCC對(duì)于這個(gè)事的文檔在這里：“Arrays of Length Zero”，文檔中給了一個(gè)例子（我改了一下，改成可以運(yùn)行的了）：

#include <stdlib.h>   
#include <string.h>   
    
struct line {   
   int length;   
   char contents[0]; // C99的玩法是：char contents[]; 沒(méi)有指定數(shù)組長(zhǎng)度   
};   
    
int main(){   
    int this_length=10;   
    struct line *thisline = (struct line *)   
                     malloc (sizeof (struct line) + this_length);   
    thisline->length = this_length;   
    memset(thisline->contents, 'a', this_length);   
    return 0;   
}

看到這里，你覺(jué)得這能算坑嗎？不要出什么事都去怪語(yǔ)言，想想是不是問(wèn)題出在自己身上。

關(guān)于零長(zhǎng)度的數(shù)組

首先，我們要知道，0長(zhǎng)度的數(shù)組在ISO C和C++的規(guī)格說(shuō)明書(shū)中是不允許的。這也就是為什么在VC++2012下編譯你會(huì)得到一個(gè)警告：“arning C4200: 使用了非標(biāo)準(zhǔn)擴(kuò)展 : 結(jié)構(gòu)/聯(lián)合中的零大小數(shù)組”。

那么為什么gcc可以通過(guò)而連一個(gè)警告都沒(méi)有？那是因?yàn)間cc 為了預(yù)先支持C99的這種玩法，所以，讓“零長(zhǎng)度數(shù)組”這種玩法合法了。關(guān)于GCC對(duì)于這個(gè)事的文檔在這里：“Arrays of Length Zero”，文檔中給了一個(gè)例子（我改了一下，改成可以運(yùn)行的了）：

#include <stdlib.h>   
#include <string.h>   
    
struct line {   
   int length;   
   char contents[0]; // C99的玩法是：char contents[]; 沒(méi)有指定數(shù)組長(zhǎng)度   
};   
    
int main(){   
    int this_length=10;   
    struct line *thisline = (struct line *)   
                     malloc (sizeof (struct line) + this_length);   
    thisline->length = this_length;   
    memset(thisline->contents, 'a', this_length);   
    return 0;   
}

上面這段代碼的意思是：我想分配一個(gè)不定長(zhǎng)的數(shù)組，于是我有一個(gè)結(jié)構(gòu)體，其中有兩個(gè)成員，一個(gè)是length，代表數(shù)組的長(zhǎng)度，一個(gè)是contents，代碼數(shù)組的內(nèi)容。后面代碼里的 this_length（長(zhǎng)度是10）代表是我想分配的數(shù)據(jù)的長(zhǎng)度。（這看上去是不是像一個(gè)C++的類？）這種玩法英文叫：Flexible Array，中文翻譯叫：柔性數(shù)組。

我們來(lái)用gdb看一下：

(gdb) p thisline   
$1 = (struct line *) 0x601010   
    
(gdb) p *thisline   
$2 = {length = 10, contents = 0x601010 "\n"}   
    
(gdb) p thisline->contents   
$3 = 0x601014 "aaaaaaaaaa"

我們可以看到：在輸出*thisline時(shí)，我們發(fā)現(xiàn)其中的成員變量contents的地址居然和thisline是一樣的（偏移量為0×0??!!）。但是當(dāng)我們輸出thisline->contents的時(shí)候，你又發(fā)現(xiàn)contents的地址是被offset了0×4了的，內(nèi)容也變成了10個(gè)‘a’。（我覺(jué)得這是一個(gè)GDB的bug，VC++的調(diào)試器就能很好的顯示）

我們繼續(xù)，如果你sizeof(char[0])或是 sizeof(int[0]) 之類的零長(zhǎng)度數(shù)組，你會(huì)發(fā)現(xiàn)sizeof返回了0，這就是說(shuō)，零長(zhǎng)度的數(shù)組是存在于結(jié)構(gòu)體內(nèi)的，但是不占結(jié)構(gòu)體的size。你可以簡(jiǎn)單的理解為一個(gè)沒(méi)有內(nèi)容的占位標(biāo)識(shí)，直到我們給結(jié)構(gòu)體分配了內(nèi)存，這個(gè)占位標(biāo)識(shí)才變成了一個(gè)有長(zhǎng)度的數(shù)組。

看到這里，你會(huì)說(shuō)，為什么要這樣搞啊，把contents聲明成一個(gè)指針，然后為它再分配一下內(nèi)存不行么？就像下面一樣。

struct line {   
   int length;   
   char *contents;   
};   
    
int main(){   
    int this_length=10;   
    struct line *thisline = (struct line *)malloc (sizeof (struct line));   
    thisline->contents = (char*) malloc( sizeof(char) * this_length );   
    thisline->length = this_length;   
    memset(thisline->contents, 'a', this_length);   
    return 0;   
}

這不一樣清楚嗎？而且也沒(méi)什么怪異難懂的東西。是的，這也是普遍的編程方式，代碼是很清晰，也讓人很容易理解。即然這樣，那為什么要搞一個(gè)零長(zhǎng)度的數(shù)組？有毛意義？！

這個(gè)事情出來(lái)的原因是——我們想給一個(gè)結(jié)構(gòu)體內(nèi)的數(shù)據(jù)分配一個(gè)連續(xù)的內(nèi)存！這樣做的意義有兩個(gè)好處：

第一個(gè)意義是，方便內(nèi)存釋放。如果我們的代碼是在一個(gè)給別人用的函數(shù)中，你在里面做了二次內(nèi)存分配，并把整個(gè)結(jié)構(gòu)體返回給用戶。用戶調(diào)用free可以釋放結(jié)構(gòu)體，但是用戶并不知道這個(gè)結(jié)構(gòu)體內(nèi)的成員也需要free，所以你不能指望用戶來(lái)發(fā)現(xiàn)這個(gè)事。所以，如果我們把結(jié)構(gòu)體的內(nèi)存以及其成員要的內(nèi)存一次性分配好了，并返回給用戶一個(gè)結(jié)構(gòu)體指針，用戶做一次free就可以把所有的內(nèi)存也給釋放掉。（讀到這里，你一定會(huì)覺(jué)得C++的封閉中的析構(gòu)函數(shù)會(huì)讓這事容易和干凈很多）

第二個(gè)原因是，這樣有利于訪問(wèn)速度。連續(xù)的內(nèi)存有益于提高訪問(wèn)速度，也有益于減少內(nèi)存碎片。（其實(shí)，我個(gè)人覺(jué)得也沒(méi)多高了，反正你跑不了要用做偏移量的加法來(lái)尋址）

我們來(lái)看看是怎么個(gè)連續(xù)的，用gdb的x命令來(lái)查看：(我們知道，用struct line {}中的那個(gè)char contents[]不占用結(jié)構(gòu)體的內(nèi)存，所以，struct line就只有一個(gè)int成員，4個(gè)字節(jié)，而我們還要為contents[]分配10個(gè)字節(jié)長(zhǎng)度，所以，一共是14個(gè)字節(jié))

(gdb) x /14b thisline   
0x601010:       10      0       0       0       97      97      97      97   
0x601018:       97      97      97      97      97      97

從上面的內(nèi)存布局我們可以看到，前4個(gè)字節(jié)是 int length，后10個(gè)字節(jié)就是char contents[]。

如果用指針的話，會(huì)變成這個(gè)樣子：

(gdb) x /16b thisline   
0x601010:       1       0       0       0       0       0       0       0   
0x601018:       32      16      96      0       0       0       0       0   
(gdb) x /10b this->contents   
0x601020:       97      97      97      97      97      97      97      97   
0x601028:       97      97

上面一共輸出了四行內(nèi)存，其中，

第一行前四個(gè)字節(jié)是 int length，第一行的后四個(gè)字節(jié)是對(duì)齊。
第二行是char* contents，64位系統(tǒng)指針8個(gè)長(zhǎng)度，他的值是0×20 0×10 0×60 也就是0×601020。
第三行和第四行是char* contents指向的內(nèi)容。

從這里，我們看到，其中的差別——數(shù)組的原地就是內(nèi)容，而指針的那里保存的是內(nèi)容的地址。

后記

好了，我的文章到這里就結(jié)束了。但是，請(qǐng)?jiān)试S我再嘮叨兩句。

1）看過(guò)這篇文章，你覺(jué)得C復(fù)雜嗎？我覺(jué)得并不簡(jiǎn)單。某些地方的復(fù)雜程度不亞于C++。

2）那些學(xué)不好C++的人一定是連C都學(xué)不好的人。連C都沒(méi)學(xué)好，你們根本沒(méi)有資格鄙視C++。

3）當(dāng)你們?cè)谡f(shuō)有坑的時(shí)候，你得問(wèn)一下自己，是真有坑還是自己的學(xué)習(xí)能力上出了問(wèn)題。

如果你覺(jué)得你的C語(yǔ)言還不錯(cuò)，歡迎你看看《C語(yǔ)言的謎題》還有《誰(shuí)說(shuō)C語(yǔ)言很簡(jiǎn)單？》還有《語(yǔ)言的歧義》以及《深入理解C語(yǔ)言》一文。

原文鏈接：http://coolshell.cn/articles/11377.html

責(zé)任編輯：林師授來(lái)源：酷殼

C語(yǔ)言指針

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)