C++中的指針與引用詳細(xì)解讀
1、指針和引用的定義
在深入介紹之前我們首先來看一下指針和引用的定義、指針和引用的區(qū)別,然后分別針對指針和引用展開討論,深入細(xì)節(jié)為何有這些差異。
-
指針的權(quán)威定義:
In a declaration T D where D has the form * cv-qualifier-seqopt D1 And the type of the identifier in the declaration T D1 is “derived-declarator-type-list T”, then the type of the identifier of D is “derived-declarator-type-list cv-qualifier-seq pointer to T”. The cv-qualifiers apply to the pointer and not to the object pointer to.
——摘自《ANSI C++ Standard》
注:可能有些讀者并不明白cv-qualifier-seq
CV-qualifiers(CV限定符)
CV-qualifiers有三種:const-qualifier(const限定符)、Volatile-qualifier(volatile限定符)、以及const-volatile-qualifier(const-volatile限定符)。
const類對象的非靜態(tài)、非mutable、以及非引用數(shù)據(jù)成員是const-qualified;
volatile類對象的非靜態(tài)、非引用數(shù)據(jù)成員是volatile-qualified;
const-volatile類對象的非靜態(tài)、非引用數(shù)據(jù)成員是const-volatile-qualified。
當(dāng)CV-qualifiers用于限定數(shù)組類型時,實際上是數(shù)組成員被該CV-qualifiers限定,而非該數(shù)組類型。
復(fù)合類型并不因其成員被CV-qualifier限定而被該CV-qualifier限定,也就是說,即使復(fù)合類型的成員有CV-qualifier限定,該復(fù)合類型也不是CV-qualified對象。
-
引用的權(quán)威定義:
In a declaration T D where D has the form& D1 And the type of the identifier in the declaration T D1 is “derived-declarator-type-list T”, then the type of the identifier of D is “derived-declarator-type-list cv-qualifier-seq reference to T”. Cv-qualified references are ill-formed except when the cv-qualifiers are introduced through the use of a typedef or a template type argument, in which case the cv-qualifiers are ignored.
——摘自《ANSI C++ Standard》
上面這些定義初看有些難懂,如果是這樣的話,那說明你對C++還不夠熟悉,你還有很長的路要走。下面用通俗易懂的話來概述一下:
-
指針-對于一個類型T,T*就是指向T的指針類型,也即一個T*類型的變量能夠保存一個T對象的地址,而類型T是可以加一些限定詞的,如const、volatile等等。見下圖,所示指針的含義:
-
引用-引用是一個對象的別名,主要用于函數(shù)參數(shù)和返回值類型,符號X&表示X類型的引用。見下圖,所示引用的含義:
#p#
2、指針和引用的區(qū)別
首先,引用不可以為空,但指針可以為***面也說過了引用是對象的別名,引用為空——對象都不存在,怎么可能有別名!故定義一個引用的時候,必須初 始化。因此如果你有一個變量是用于指向另一個對象,但是它可能為空,這時你應(yīng)該使用指針;如果變量總是指向一個對象,i.e.,你的設(shè)計不允許變量為空, 這時你應(yīng)該使用引用。如下圖中,如果定義一個引用變量,不初始化的話連編譯都通不過(編譯時錯誤):
而聲明指針是可以不指向任何對象,也正是因為這個原因,使用指針之前必須做判空操作,而引用就不必。
-
其次,引用不可以改變指向,對一個對象”至死不渝”;但是指針可以改變指向,而指向其它對象。說明:雖然引用不可以改變指向,但是可以改變初始化 對象的內(nèi)容。例如就++操作而言,對引用的操作直接反應(yīng)到所指向的對象,而不是改變指向;而對指針的操作,會使指針指向下一個對象,而不是改變所指對象的 內(nèi)容。見下面的代碼:
- #include<iostream>
- using namespace std;
- int main(int argc,char** argv)
- {
- int i=10;
- int& ref=i;
- ref++;
- cout<<"i="<<i<<endl;
- cout<<"ref="<<ref<<endl;
- int j=20;
- ref=j;
- ref++;
- cout<<"i="<<i<<endl;
- cout<<"ref="<<ref<<endl;
- cout<<"j="<<j<<endl;
- return 0;
- }
對ref的++操作是直接反應(yīng)到所指變量之上,對引用變量ref重新賦值”ref=j”,并不會改變ref的指向,它仍然指向的是i,而不是j。理所當(dāng)然,這時對ref進(jìn)行++操作不會影響到j(luò)。而這些換做是指針的話,情況大不相同,請自行實驗。輸出結(jié)果如下:
-
再次,引用的大小是所指向的變量的大小,因為引用只是一個別名而已;指針是指針本身的大小,4個字節(jié)。見下圖所示:
從上面也可以看出:引用比指針使用起來形式上更漂亮,使用引用指向的內(nèi)容時可以之間用引用變量名,而不像指針一樣要使用*;定義引用的時候也不用像指針一樣使用&取址。
-
***,引用比指針更安全。由于不存在空引用,并且引用一旦被初始化為指向一個對象,它就不能被改變?yōu)榱硪粋€對象的引用,因此引用很安全。對于指針 來說,它可以隨時指向別的對象,并且可以不被初始化,或為NULL,所以不安全。const 指針雖然不能改變指向,但仍然存在空指針,并且有可能產(chǎn)生野指針(即多個指針指向一塊內(nèi)存,free掉一個指針之后,別的指針就成了野指針)。
總而言之,言而總之——它們的這些差別都可以歸結(jié)為”指針指向一塊內(nèi)存,它的內(nèi)容是所指內(nèi)存的地址;而引用則是某塊內(nèi)存的別名,引用不改變指向。”
#p#
3、特別之處const
在這里我為什么要提到const關(guān)鍵字呢?因為const對指針和引用的限定是有差別的,下面聽我一一到來。
-
常量指針VS常量引用
常量指針:指向常量的指針,在指針定義語句的類型前加const,表示指向的對象是常量。
定義指向常量的指針只限制指針的間接訪問操作,而不能規(guī)定指針指向的值本身的操作規(guī)定性。
常量指針定義”const int* pointer=&a”告訴編譯器,*pointer是常量,不能將*pointer作為左值進(jìn)行操作。
常量引用:指向常量的引用,在引用定義語句的類型前加const,表示指向的對象是常量。也跟指針一樣不能利用引用對指向的變量進(jìn)行重新賦值操作。
-
指針常量VS引用常量
在指針定義語句的指針名前加const,表示指針本身是常量。在定義指針常量時必須初始化!而這是引用天生具來的屬性,不用再引用指針定義語句的引用名前加const。
指針常量定義”int* const pointer=&b”告訴編譯器,pointer是常量,不能作為左值進(jìn)行操作,但是允許修改間接訪問值,即*pointer可以修改。
-
常量指針常量VS常量引用常量
常量指針常量:指向常量的指針常量,可以定義一個指向常量的指針常量,它必須在定義時初始化。常量指針常量定義”const int* const pointer=&c”告訴編譯器,pointer和*pointer都是常量,他們都不能作為左值進(jìn)行操作。
而就不存在所謂的”常量引用常量”,因為跟上面講的一樣引用變量就是引用常量。C++不區(qū)分變量的const引用和const變量的引用。程序決不 能給引用本身重新賦值,使他指向另一個變量,因此引用總是const的。如果對引用應(yīng)用關(guān)鍵字const,起作用就是使其目標(biāo)稱為const變量。即沒 有:Const double const& a=1;只有const double& a=1;
總結(jié):有一個規(guī)則可以很好的區(qū)分const是修飾指針,還是修飾指針指向的數(shù)據(jù)——畫一條垂直穿過指針聲明的星號(*),如果const出現(xiàn)在線的左邊,指針指向的數(shù)據(jù)為常量;如果const出現(xiàn)在右邊,指針本身為常量。而引用本身與天俱來就是常量,即不可以改變指向。
#p#
4、指針和引用的實現(xiàn)
我們利用下面一段簡單的代碼來深入分析指針和引用:
- #include<iostream>
- using namespace std;
- int main(int argc, char** argv)
- {
- int i=1;
- int& ref=i;
- int x=ref;
- cout<<"x is "<<x<<endl;
- ref=2;
- int* p=&i;
- cout<<"ref = "<<ref<<", i = "<<i<<endl;
- }
上面的代碼用g++ test.c編譯之后,然后反匯編objdump -d a.out,得到main函數(shù)的一段匯編代碼如下:
- 08048714 <main>:
- 8048714: 55 push %ebp
- 8048715: 89 e5 mov %esp,%ebp
- 8048717: 83 e4 f0 and $0xfffffff0,%esp//為main函數(shù)的參數(shù)argc、argv保留位置
- 804871a: 56 push %esi
- 804871b: 53 push %ebx
- 804871c: 83 ec 28 sub $0x28,%esp
- 804871f: c7 44 24 1c 01 00 00 movl $0x1,0x1c(%esp) //將0x1存到esp寄存器中,即int i=1
- 8048726: 00
- 8048727: 8d 44 24 1c lea 0x1c(%esp),%eax// esp寄存器里的變量i的地址傳給eax
- 804872b: 89 44 24 18 mov %eax,0x18(%esp)//將寄存器eax中的內(nèi)容(i的地址)傳給寄存器中的變量ref,即int& ref=i
- 804872f: 8b 44 24 18 mov 0x18(%esp),%eax//將寄存器esp中的ref傳給eax,即i的地址
- 8048733: 8b 00 mov (%eax),%eax//以寄存器eax中的值作為地址,取出值給eax 8048735: 89 44 24 14 mov %eax,0x14(%esp) //將寄存器eax中的值傳給寄存器esp中的x,即x=ref
- 8048739: c7 44 24 04 00 89 04 movl $0x8048900,0x4(%esp)
- 8048740: 08
- 8048741: c7 04 24 40 a0 04 08 movl $0x804a040,(%esp)
- 8048748: e8 cb fe ff ff call 8048618 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
- 804874d: 8b 54 24 14 mov 0x14(%esp),%edx
- 8048751: 89 54 24 04 mov %edx,0x4(%esp)
- 8048755: 89 04 24 mov %eax,(%esp)
- 8048758: e8 5b fe ff ff call 80485b8 <_ZNSolsEi@plt>
- 804875d: c7 44 24 04 38 86 04 movl $0x8048638,0x4(%esp)
- 8048764: 08
- 8048765: 89 04 24 mov %eax,(%esp)
- 8048768: e8 bb fe ff ff call 8048628 <_ZNSolsEPFRSoS_E@plt>//從8048739~8048768這些行就是執(zhí)行"cout<<"x is "<<x<<endl;"
- 804876d: 8b 44 24 18 mov 0x18(%esp),%eax//將寄存器esp中的ref傳到eax中
- 8048771: c7 00 02 00 00 00 movl $0x2,(%eax) //將0x2存到eax寄存器中
- 8048777: 8d 44 24 1c lea 0x1c(%esp),%eax// esp寄存器里的變量i的地址傳給eax
- 804877b: 89 44 24 10 mov %eax,0x10(%esp) //將寄存器eax中的內(nèi)容(即i的地址)傳到寄存器esp中的p
- 804877f: 8b 5c 24 1c mov 0x1c(%esp),%ebx
- 8048783: 8b 44 24 18 mov 0x18(%esp),%eax
- 8048787: 8b 30 mov (%eax),%esi
- 8048789: c7 44 24 04 06 89 04 movl $0x8048906,0x4(%esp)
- 8048790: 08
- 8048791: c7 04 24 40 a0 04 08 movl $0x804a040,(%esp)
- 8048798: e8 7b fe ff ff call 8048618 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
- 804879d: 89 74 24 04 mov %esi,0x4(%esp)
- 80487a1: 89 04 24 mov %eax,(%esp)
- 80487a4: e8 0f fe ff ff call 80485b8 <_ZNSolsEi@plt>
- 80487a9: c7 44 24 04 0d 89 04 movl $0x804890d,0x4(%esp)
- 80487b0: 08
- 80487b1: 89 04 24 mov %eax,(%esp)
- 80487b4: e8 5f fe ff ff call 8048618 <_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@plt>
- 80487b9: 89 5c 24 04 mov %ebx,0x4(%esp)
- 80487bd: 89 04 24 mov %eax,(%esp)
- 80487c0: e8 f3 fd ff ff call 80485b8 <_ZNSolsEi@plt>
- 80487c5: c7 44 24 04 38 86 04 movl $0x8048638,0x4(%esp)
- 80487cc: 08
- 80487cd: 89 04 24 mov %eax,(%esp)
- 80487d0: e8 53 fe ff ff call 8048628 <_ZNSolsEPFRSoS_E@plt>//這些行就是執(zhí)行"cout<<"ref = "<<ref<<", i = "<<i<<endl;"
- 80487d5: b8 00 00 00 00 mov $0x0,%eax
- 80487da: 83 c4 28 add $0x28,%esp
- 80487dd: 5b pop %ebx
- 80487de: 5e pop %esi
- 80487df: 89 ec mov %ebp,%esp
- 80487e1: 5d pop %ebp
- 80487e2: c3 ret
從匯編代碼可以看出實際上指針和引用在編譯器中的實現(xiàn)是一樣的:
-
引用int& ref=i;
8048727: 8d 44 24 1c lea 0x1c(%esp),%eax// esp寄存器里的變量i的地址傳給eax
804872b: 89 44 24 18 mov %eax,0×18(%esp)//將寄存器eax中的內(nèi)容(i的地址)傳給寄存器中的變量ref,即int& ref=i
-
指針int* p=&i;
8048777: 8d 44 24 1c lea 0x1c(%esp),%eax// esp寄存器里的變量i的地址傳給eax
804877b: 89 44 24 10 mov %eax,0×10(%esp) //將寄存器eax中的內(nèi)容(即i的地址)傳到寄存器esp中的p
雖然指針和引用最終在編譯中的實現(xiàn)是一樣的,但是引用的形式大大方便了使用也更安全。有人說:”引用只是一個別名,不會占內(nèi)存空間?”通過這個事實我們可以揭穿這個謊言!實際上引用也是占內(nèi)存空間的。
#p#
5、指針傳遞和引用傳遞
為了更好的理解指針和引用,我們下面來介紹一下指針傳遞和引用傳遞。當(dāng)指針和引用作為函數(shù)的函數(shù)是如何傳值的呢?(下面這一段引用了C++中引用傳遞與指針傳遞區(qū)別(進(jìn)一步整理))
-
指針傳遞參數(shù)本質(zhì)上是值傳遞的方式,它所傳遞的是一個地址值。值傳遞過程中,被調(diào)函數(shù)的形式參數(shù)作為被調(diào)函數(shù)的局部變量處理,即在棧中開辟了內(nèi)存 空間以存放由主調(diào)函數(shù)放進(jìn)來的實參的值,從而成為了實參的一個副本。值傳遞的特點是被調(diào)函數(shù)對形式參數(shù)的任何操作都是作為局部變量進(jìn)行,不會影響主調(diào)函數(shù) 的實參變量的值。
-
引用傳遞過程中,被調(diào)函數(shù)的形式參數(shù)也作為局部變量在棧中開辟了內(nèi)存空間,但是這時存放的是由主調(diào)函數(shù)放進(jìn)來的實參變量的地址。被調(diào)函數(shù)對形參的 任何操作都被處理成間接尋址,即通過棧中存放的地址訪問主調(diào)函數(shù)中的實參變量。正因為如此,被調(diào)函數(shù)對形參做的任何操作都影響了主調(diào)函數(shù)中的實參變量。
引用傳遞和指針傳遞是不同的,雖然它們都是在被調(diào)函數(shù)??臻g上的一個局部變量,但是任何對于引用參數(shù)的處理都會通過一個間接尋址的方式操作到主調(diào)函 數(shù)中的相關(guān)變量。而對于指針傳遞的參數(shù),如果改變被調(diào)函數(shù)中的指針地址,它將影響不到主調(diào)函數(shù)的相關(guān)變量。如果想通過指針參數(shù)傳遞來改變主調(diào)函數(shù)中的相關(guān) 變量,那就得使用指向指針的指針,或者指針引用。
參考文獻(xiàn)
[1]The C++ Programming Language(Special Edition),Bjarne Stroustrup
[2] ANSI C++ Standard
[3] 匯編語言