C++ 指針詳解
指針是一個(gè)特殊的變量,它里面存儲(chǔ)的數(shù)值被解釋成為內(nèi)存里的一個(gè)地址。要搞清一個(gè)指針需要搞清指針的四方面的內(nèi)容:指針的類型,指針?biāo)赶虻念愋?,指針的值或者叫指針?biāo)赶虻膬?nèi)存區(qū),還有指針本身所占據(jù)的內(nèi)存區(qū)。讓我們分別說明。
先聲明幾個(gè)指針放著做例子:
例一:
- int*ptr;
- char*ptr;
- int**ptr;
- int(*ptr)[3];
- int*(*ptr)[4];
指針的類型
從語法的角度看,你只要把指針聲明語句里的指針名字去掉,剩下的部分就是這個(gè)指針的類型。這是指針本身所具有的類型。讓我們看看例一中各個(gè)指針的類型:
- int *ptr; //指針的類型是int *
- char *ptr; //指針的類型是char *
- int **ptr; //指針的類型是 int **
- int (*ptr)[3]; //指針的類型是 int(*)[3]
- int *(*ptr)[4]; //指針的類型是 int *(*)[4]
怎么樣?找出指針的類型的方法是不是很簡單?
指針?biāo)赶虻念愋?/h3>
當(dāng)你通過指針來訪問指針?biāo)赶虻膬?nèi)存區(qū)時(shí),指針?biāo)赶虻念愋蜎Q定了編譯器將把那片內(nèi)存區(qū)里的內(nèi)容當(dāng)做什么來看待。
從語法上看,你只需把指針聲明語句中的指針名字和名字左邊的指針聲明符*去掉,剩下的就是指針?biāo)赶虻念愋汀@纾?nbsp;
- int *ptr; //指針?biāo)赶虻念愋褪莍nt
- char *ptr; //指針?biāo)赶虻牡念愋褪莄har
- int **ptr; //指針?biāo)赶虻牡念愋褪?nbsp;int *
- int (*ptr)[3]; //指針?biāo)赶虻牡念愋褪?nbsp;int()[3]
- int *(*ptr)[4]; //指針?biāo)赶虻牡念愋褪?nbsp;int *()[4]
在指針的算術(shù)運(yùn)算中,指針?biāo)赶虻念愋陀泻艽蟮淖饔谩?/p>
指針的類型(即指針本身的類型)和指針?biāo)赶虻念愋褪莾蓚€(gè)概念。當(dāng)你對(duì)C越來越熟悉時(shí),你會(huì)發(fā)現(xiàn),把與指針攪和在一起的“類型”這個(gè)概念分成“指針的類型”和“指針?biāo)赶虻念愋?rdquo;兩個(gè)概念,是精通指針的關(guān)鍵點(diǎn)之一。我看了不少書,發(fā)現(xiàn)有些寫得差的書中,就把指針的這兩個(gè)概念攪在一起了,所以看起書來前后矛盾,越看越糊涂。
指針的值
指針的值是指針本身存儲(chǔ)的數(shù)值,這個(gè)值將被編譯器當(dāng)作一個(gè)地址,而不是一個(gè)一般的數(shù)值。在32位程序里,所有類型的指針的值都是一個(gè)32位整數(shù),因?yàn)?2位程序里內(nèi)存地址全都是32位長。
指針?biāo)赶虻膬?nèi)存區(qū)就是從指針的值所代表的那個(gè)內(nèi)存地址開始,長度為sizeof(指針?biāo)赶虻念愋?的一片內(nèi)存區(qū)。以后,我們說一個(gè)指針的值是XX,就相當(dāng)于說該指針指向了以XX為首地址的一片內(nèi)存區(qū)域;我們說一個(gè)指針指向了某塊內(nèi)存區(qū)域,就相當(dāng)于說該指針的值是這塊內(nèi)存區(qū)域的首地址。
指針?biāo)赶虻膬?nèi)存區(qū)和指針?biāo)赶虻念愋褪莾蓚€(gè)完全不同的概念。在例一中,指針?biāo)赶虻念愋鸵呀?jīng)有了,但由于指針還未初始化,所以它所指向的內(nèi)存區(qū)是不存在的,或者說是無意義的。
以后,每遇到一個(gè)指針,都應(yīng)該問問:這個(gè)指針的類型是什么?指針指向的類型是什么?該指針指向了哪里?
指針本身所占據(jù)的內(nèi)存區(qū)
指針本身占了多大的內(nèi)存?你只要用函數(shù)sizeof(指針的類型)測(cè)一下就知道了。在32位平臺(tái)里,指針本身占據(jù)了4個(gè)字節(jié)的長度。
指針本身占據(jù)的內(nèi)存這個(gè)概念在判斷一個(gè)指針表達(dá)式是否是左值時(shí)很有用。
指針的算術(shù)運(yùn)算
指針可以加上或減去一個(gè)整數(shù)。指針的這種運(yùn)算的意義和通常的數(shù)值的加減運(yùn)算的意義是不一樣的。例如:
例二:
- char a[20];
- int *ptr=a;
- ...
- .. ptr++;
在上例中,指針ptr的類型是int*,它指向的類型是int,它被初始化為指向整形變量a。接下來的第3句中,指針ptr被加了1,編譯器是這樣處理的:它把指針ptr的值加上了sizeof(int),在32位程序中,是被加上了4。由于地址是用字節(jié)做單位的,故ptr所指向的地址由原來的變量a的地址向高地址方向增加了4個(gè)字節(jié)。
由于char類型的長度是一個(gè)字節(jié),所以,原來ptr是指向數(shù)組a的第0號(hào)單元開始的四個(gè)字節(jié),此時(shí)指向了數(shù)組a中從第4號(hào)單元開始的四個(gè)字節(jié)。
我們可以用一個(gè)指針和一個(gè)循環(huán)來遍歷一個(gè)數(shù)組,看例子:
例三:
- int array[20];
- int *ptr=array;
- ...
- //此處略去為整型數(shù)組賦值的代碼。
- ...
- for(i=0;i<20;i++)
- {
- (*ptr)++;
- ptr++;
- }
這個(gè)例子將整型數(shù)組中各個(gè)單元的值加1。由于每次循環(huán)都將指針ptr加1,所以每次循環(huán)都能訪問數(shù)組的下一個(gè)單元。再看例子:
例四:
- char a[20];
- int *ptr = a;
- ...
- ...
- ptr += 5;
在這個(gè)例子中,ptr被加上了5,編譯器是這樣處理的:將指針ptr的值加上5乘sizeof(int),在32位程序中就是加上了5乘4=20。由于地址的單位是字節(jié),故現(xiàn)在的ptr所指向的地址比起加5后的ptr所指向的地址來說,向高地址方向移動(dòng)了20個(gè)字節(jié)。在這個(gè)例子中,沒加5前的ptr指向數(shù)組a的第0號(hào)單元開始的四個(gè)字節(jié),加5后,ptr已經(jīng)指向了數(shù)組a的合法范圍之外了。雖然這種情況在應(yīng)用上會(huì)出問題,但在語法上卻是可以的。這也體現(xiàn)出了指針的靈活性。
如果上例中,ptr是被減去5,那么處理過程大同小異,只不過ptr的值是被減去5乘sizeof(int),新的ptr指向的地址將比原來的ptr所指向的地址向低地址方向移動(dòng)了20個(gè)字節(jié)。
總結(jié)一下,一個(gè)指針ptrold加上一個(gè)整數(shù)n后,結(jié)果是一個(gè)新的指針ptrnew,ptrnew的類型和ptrold的類型相同,ptrnew所指向的類型和ptrold所指向的類型也相同。ptrnew的值將比ptrold的值增加了n乘sizeof(ptrold所指向的類型)個(gè)字節(jié)。就是說,ptrnew所指向的內(nèi)存區(qū),將比ptrold所指向的內(nèi)存區(qū),向高地址方向移動(dòng)了n乘sizeof(ptrold所指向的類型)個(gè)字節(jié)。一個(gè)指針ptrold減去一個(gè)整數(shù)n后,結(jié)果是一個(gè)新的指針ptrnew,ptrnew的類型和ptrold的類型相同,ptrnew所指向的類型和ptrold所指向的類型也相同。ptrnew的值將比ptrold的值,減少了n乘sizeof(ptrold所指向的類型)個(gè)字節(jié),就是說,ptrnew所指向的內(nèi)存區(qū),將比ptrold所指向的內(nèi)存區(qū),向低地址方向移動(dòng)了n乘sizeof(ptrold所指向的類型)個(gè)字節(jié)。
運(yùn)算符&和*
這里&是取地址運(yùn)算符,*是...書上叫做“間接運(yùn)算符”。&a的運(yùn)算結(jié)果是一個(gè)指針,指針的類型是a的類型加個(gè)*,指針?biāo)赶虻念愋褪莂的類型,指針?biāo)赶虻牡刂仿?,那就是a的地址。*p的運(yùn)算結(jié)果就五花八門了??傊?p的結(jié)果是p所指向的東西,這個(gè)東西有這些特點(diǎn):它的類型是p指向的類型,它所占用的地址是p所指向的地址。
例五:
- int a=12;
- int b;
- int *p;
- int **ptr;
- p=&a;//&a的結(jié)果是一個(gè)指針,類型是int*,指向的類型是int,指向的地址是a的地址。
- *p=24;//*p的結(jié)果,在這里它的類型是int,它所占用的地址是p所指向的地址,顯然,*p就是變量a。
- ptr=&p;//&p的結(jié)果是個(gè)指針,該指針的類型是p的類型加個(gè)*,在這里是int**。該指針?biāo)赶虻念愋褪莗的類型,這里是int*。該指針?biāo)赶虻牡刂肪褪侵羔榩自己的地址。
- *ptr=&b;//*ptr是個(gè)指針,&b的結(jié)果也是個(gè)指針,且這兩個(gè)指針的類型和所指向的類型是一樣的,所以?amp;b來給*ptr賦值就是毫無問題的了。
- **ptr=34;//*ptr的結(jié)果是ptr所指向的東西,在這里是一個(gè)指針,對(duì)這個(gè)指針再做一次*運(yùn)算,結(jié)果就是一個(gè)int類型的變量。
指針表達(dá)式
一個(gè)表達(dá)式的最后結(jié)果如果是一個(gè)指針,那么這個(gè)表達(dá)式就叫指針表達(dá)式。下面是一些指針表達(dá)式的例子:
例六:
- int a,b;
- int array[10];
- int *pa;
- pa=&a;//&a是一個(gè)指針表達(dá)式。
- int **ptr=&pa;//&pa也是一個(gè)指針表達(dá)式。
- *ptr=&b;//*ptr和&b都是指針表達(dá)式。
- pa=array;
- pa++;//這也是指針表達(dá)式。
例七:
- char *arr[20];
- char **parr=arr;//如果把a(bǔ)rr看作指針的話,arr也是指針表達(dá)式
- char *str;
- str=*parr;//*parr是指針表達(dá)式
- str=*(parr+1);//*(parr+1)是指針表達(dá)式
- str=*(parr+2);//*(parr+2)是指針表達(dá)式
由于指針表達(dá)式的結(jié)果是一個(gè)指針,所以指針表達(dá)式也具有指針?biāo)哂械乃膫€(gè)要素:指針的類型,指針?biāo)赶虻念愋?,指針指向的?nèi)存區(qū),指針自身占據(jù)的內(nèi)存。
好了,當(dāng)一個(gè)指針表達(dá)式的結(jié)果指針已經(jīng)明確地具有了指針自身占據(jù)的內(nèi)存的話,這個(gè)指針表達(dá)式就是一個(gè)左值,否則就不是一個(gè)左值。在例七中,&a不是一個(gè)左值,因?yàn)樗€沒有占據(jù)明確的內(nèi)存。*ptr是一個(gè)左值,因?yàn)?ptr這個(gè)指針已經(jīng)占據(jù)了內(nèi)存,其實(shí)*ptr就是指針pa,既然pa已經(jīng)在內(nèi)存中有了自己的位置,那么*ptr當(dāng)然也有了自己的位置。
數(shù)組和指針的關(guān)系
如果對(duì)聲明數(shù)組的語句不太明白的話,請(qǐng)參閱我前段時(shí)間貼出的文章<<如何理解c和c++的復(fù)雜類型聲明>>。數(shù)組的數(shù)組名其實(shí)可以看作一個(gè)指針??聪吕?/p>
例八:
- int array[10]={0,1,2,3,4,5,6,7,8,9},value;
- ...
- ...
- value=array[0];//也可寫成:value=*array;
- value=array[3];//也可寫成:value=*(array+3);
- value=array[4];//也可寫成:value=*(array+4);
上例中,一般而言數(shù)組名array代表數(shù)組本身,類型是int [10],但如果把a(bǔ)rray看做指針的話,它指向數(shù)組的第0個(gè)單元,類型是int *,所指向的類型是數(shù)組單元的類型即int。因此*array等于0就一點(diǎn)也不奇怪了。同理,array+3是一個(gè)指向數(shù)組第3個(gè)單元的指針,所以*(array+3)等于3。其它依此類推。
例九:
- char *str[3]={
- "Hello,this is a sample!",
- Hi,good morning.",
- "Hello world"
- };
- char s[80];
- strcpy(s,str[0]);//也可寫成strcpy(s,*str);
- strcpy(s,str[1]);//也可寫成strcpy(s,*(str+1));
- strcpy(s,str[2]);//也可寫成strcpy(s,*(str+2));
上例中,str是一個(gè)三單元的數(shù)組,該數(shù)組的每個(gè)單元都是一個(gè)指針,這些指針各指向一個(gè)字符串。把指針數(shù)組名str當(dāng)作一個(gè)指針的話,它指向數(shù)組的第0號(hào)單元,它的類型是char*,它指向的類型是char 。
*str也是一個(gè)指針,它的類型是char*,它所指向的類型是char,它指向的地址是字符串"Hello,this is a sample!"的第一個(gè)字符的地址,即'H'的地址。str+1也是一個(gè)指針,它指向數(shù)組的第1號(hào)單元,它的類型是char*,它指向的類型是char 。
*(str+1)也是一個(gè)指針,它的類型是char*,它所指向的類型是char,它指向"Hi,good morning."的第一個(gè)字符'H',等等。
下面總結(jié)一下數(shù)組的數(shù)組名的問題。聲明了一個(gè)數(shù)組TYPE array[n],則數(shù)組名稱array就有了兩重含義:第一,它代表整個(gè)數(shù)組,它的類型是TYPE [n];第二,它是一個(gè)指針,該指針的類型是TYPE*,該指針指向的類型是TYPE,也就是數(shù)組單元的類型,該指針指向的內(nèi)存區(qū)就是數(shù)組第0號(hào)單元,該指針自己占有單獨(dú)的內(nèi)存區(qū),注意它和數(shù)組第0號(hào)單元占據(jù)的內(nèi)存區(qū)是不同的。該指針的值是不能修改的,即類似array++的表達(dá)式是錯(cuò)誤的。
在不同的表達(dá)式中數(shù)組名array可以扮演不同的角色。
在表達(dá)式sizeof(array)中,數(shù)組名array代表數(shù)組本身,故這時(shí)sizeof函數(shù)測(cè)出的是整個(gè)數(shù)組的大小。
在表達(dá)式*array中,array扮演的是指針,因此這個(gè)表達(dá)式的結(jié)果就是數(shù)組第0號(hào)單元的值。sizeof(*array)測(cè)出的是數(shù)組單元的大小。
表達(dá)式array+n(其中n=0,1,2,....。)中,array扮演的是指針,故array+n的結(jié)果是一個(gè)指針,它的類型是TYPE*,它指向的類型是TYPE,它指向數(shù)組第n號(hào)單元。故sizeof(array+n)測(cè)出的是指針類型的大小。
例十:
- int array[10];
- int (*ptr)[10];
- ptr=&array;
上例中ptr是一個(gè)指針,它的類型是int (*)[10],他指向的類型是int [10],我們用整個(gè)數(shù)組的首地址來初始化它。在語句ptr=&array中,array代表數(shù)組本身。
本節(jié)中提到了函數(shù)sizeof(),那么我來問一問,sizeof(指針名稱)測(cè)出的究竟是指針自身類型的大小呢,還是指針?biāo)赶虻念愋偷拇笮。看鸢甘乔罢?。例如?/p>
- int (*ptr)[10];
則在32位程序中,有:
- sizeof(int(*)[10])==4
- sizeof(int [10])==40
- sizeof(ptr)==4
實(shí)際上,sizeof(對(duì)象)測(cè)出的都是對(duì)象自身的類型的大小,而不是別的什么類型的大小。
指針和結(jié)構(gòu)類型的關(guān)系
可以聲明一個(gè)指向結(jié)構(gòu)類型對(duì)象的指針。
例十一:
- struct MyStruct
- {
- int a;
- int b;
- int c;
- }
- MyStruct ss={20,30,40};//聲明了結(jié)構(gòu)對(duì)象ss,并把ss的三個(gè)成員初始化為20,30和40。
- MyStruct *ptr=&ss;//聲明了一個(gè)指向結(jié)構(gòu)對(duì)象ss的指針。它的類型是MyStruct*,它指向的類型是MyStruct。
- int *pstr=(int*)&ss;//聲明了一個(gè)指向結(jié)構(gòu)對(duì)象ss的指針。但是它的類型和它指向的類型和ptr是不同的。
請(qǐng)問怎樣通過指針ptr來訪問ss的三個(gè)成員變量?
答案:
- ptr->a;
- ptr->b;
- ptr->c;
又請(qǐng)問怎樣通過指針pstr來訪問ss的三個(gè)成員變量?
答案:
- *pstr;//訪問了ss的成員a。
- *(pstr+1);//訪問了ss的成員b。
- *(pstr+2)//訪問了ss的成員c。
呵呵,雖然我在我的MSVC++6.0上調(diào)試過上述代碼,但是要知道,這樣使用pstr來訪問結(jié)構(gòu)成員是不正規(guī)的,為了說明為什么不正規(guī),讓我們看看怎樣通過指針來訪問數(shù)組的各個(gè)單元:
例十二:
- int array[3]={35,56,37};
- int *pa=array;
通過指針pa訪問數(shù)組array的三個(gè)單元的方法是:
- *pa;//訪問了第0號(hào)單元
- *(pa+1);//訪問了第1號(hào)單元
- *(pa+2);//訪問了第2號(hào)單元
從格式上看倒是與通過指針訪問結(jié)構(gòu)成員的不正規(guī)方法的格式一樣。
所有的C/C++編譯器在排列數(shù)組的單元時(shí),總是把各個(gè)數(shù)組單元存放在連續(xù)的存儲(chǔ)區(qū)里,單元和單元之間沒有空隙。但在存放結(jié)構(gòu)對(duì)象的各個(gè)成員時(shí),在某種編譯環(huán)境下,可能會(huì)需要字對(duì)齊或雙字對(duì)齊或者是別的什么對(duì)齊,需要在相鄰兩個(gè)成員之間加若干個(gè)“填充字節(jié)”,這就導(dǎo)致各個(gè)成員之間可能會(huì)有若干個(gè)字節(jié)的空隙。
所以,在例十二中,即使pstr訪問到了結(jié)構(gòu)對(duì)象ss的第一個(gè)成員變量a,也不能保證`(pstr+1)就一定能訪問到結(jié)構(gòu)成員b。因?yàn)槌蓡Ta和成員b之間可能會(huì)有若干填充字節(jié),說不定*(pstr+1)`就正好訪問到了這些填充字節(jié)呢。這也證明了指針的靈活性。要是你的目的就是想看看各個(gè)結(jié)構(gòu)成員之間到底有沒有填充字節(jié),嘿,這倒是個(gè)不錯(cuò)的方法。
通過指針訪問結(jié)構(gòu)成員的正確方法應(yīng)該是象例十二中使用指針ptr的方法。
指針和函數(shù)的關(guān)系
可以把一個(gè)指針聲明成為一個(gè)指向函數(shù)的指針。
- int fun1(char*,int);
- int (*pfun1)(char*,int);
- pfun1=fun1;
- ....
- ....
- int a=(*pfun1)("abcdefg",7);//通過函數(shù)指針調(diào)用函數(shù)。
可以把指針作為函數(shù)的形參。在函數(shù)調(diào)用語句中,可以用指針表達(dá)式來作為實(shí)參。