C#引用類型詳細(xì)剖析
C#引用類型和值類型的區(qū)別——值類型和引用類型在內(nèi)存中的部署
經(jīng)常聽(tīng)說(shuō),并且經(jīng)常在書上看到:值類型部署在棧上,引用類型部署在托管堆上。實(shí)際上并沒(méi)有這么簡(jiǎn)單。
MSDN上說(shuō):托管堆上部署了所有引用類型。這很容易理解。當(dāng)創(chuàng)建一個(gè)應(yīng)用類型變量時(shí):
- object reference = new object();
關(guān)鍵字new將在托管堆上分配內(nèi)存空間,并返回一個(gè)該內(nèi)存空間的地址。左邊的reference位于棧上,是一個(gè)引用,存儲(chǔ)著一個(gè)內(nèi)存地址;而這個(gè)地址指向的內(nèi)存(位于托管堆)里存儲(chǔ)著其內(nèi)容(一個(gè)System.Object的實(shí)例)。下面為了方便,簡(jiǎn)稱引用類型部署在托管推上。
再來(lái)看值類型。《C#語(yǔ)言規(guī)范》上的措辭是“結(jié)構(gòu)體不要求在堆上分配內(nèi)存(However, unlike classes, structs are value types and do not require heap allocation)”而不是“結(jié)構(gòu)體在棧上分配內(nèi)存”。這不免容易讓人感到困惑:值類型究竟部署在什么地方?
數(shù)組
考慮數(shù)組:
- int[] reference = new int[100];
根據(jù)定義,數(shù)組都是引用類型,所以int數(shù)組當(dāng)然是引用類型(即reference.GetType().IsValueType為false)。
而int數(shù)組的元素都是int,根據(jù)定義,int是值類型(即reference[i].GetType().IsValueType為true)。那么引用類型數(shù)組中的值類型元素究竟位于棧還是堆?
如果用WinDbg去看reference[i]在內(nèi)存中的具體位置,就會(huì)發(fā)現(xiàn)它們并不在棧上,而是在托管堆上。
實(shí)際上,對(duì)于數(shù)組:
- TestType[] testTypes = new TestType[100];
如果TestType是值類型,則會(huì)一次在托管堆上為100個(gè)值類型的元素分配存儲(chǔ)空間,并自動(dòng)初始化這100個(gè)元素,將這100個(gè)元素存儲(chǔ)到這塊內(nèi)存里。
如果TestType是引用類型,則會(huì)先在托管堆為testTypes分配一次空間,并且這時(shí)不會(huì)自動(dòng)初始化任何元素(即testTypes[i]均為null)。等到以后有代碼初始化某個(gè)元素的時(shí)候,這個(gè)引用類型元素的存儲(chǔ)空間才會(huì)被分配在托管堆上。
類型嵌套
更容易讓人困惑的是引用類型包含值類型,以及值類型包含引用類型的情況:
- public class ReferenceTypeClass
- {
- private int _valueTypeField;
- public ReferenceTypeClass()
- {
- _valueTypeField = 0;
- }
- public void Method()
- {
- int valueTypeLocalVariable = 0;
- }
- }
- ReferenceTypeClass referenceTypeClassInstance = new ReferenceTypeClass();//Where is _valueTypeField?
- referenceTypeClassInstance.Method();//Where is valueTypeLocalVariable?
- public struct ValueTypeStruct
- {
- private object _referenceTypeField;
- public void Method()
- {
- _referenceTypeField = new object();
- object referenceTypeLocalVariable = new object();
- }
- }
- ValueTypeStruct valueTypeStructInstance = new ValueTypeStruct();
- valueTypeStructInstance.Method();//Where is _referenceTypeField?And where is referenceTypeLocalVariable?
單看valueTypeStructInstance,這是一個(gè)結(jié)構(gòu)體實(shí)例,感覺(jué)似乎是整塊扔到棧上的。但是字段_referenceTypeField是引用類型,局部變量referenceTypeLocalVarible也是引用類型。
referenceTypeClassInstance也有同樣的問(wèn)題,referenceTypeClassInstance本身是引用類型,似乎應(yīng)該整塊部署在托管堆上。但字段_valueTypeField是值類型,局部變量valueTypeLocalVariable也是值類型,它們究竟是在棧上還是在托管堆上?
規(guī)律是:
引用類型部署在托管堆上; 值類型總是分配在它聲明的地方:作為字段時(shí),跟隨其所屬的變量(實(shí)例)存儲(chǔ);作為局部變量時(shí),存儲(chǔ)在棧上。 我們來(lái)分析一下上面的代碼。
對(duì)于引用類型實(shí)例,即referenceTypeClassInstance:
從上下文看,referenceTypeClassInstance是一個(gè)局部變量,所以部署在托管堆上,并被棧上的一個(gè)引用所持有; 值類型字段_valueTypeField屬于引用類型實(shí)例referenceTypeClassInstance的一部分,所以跟隨引用類型實(shí)例referenceTypeClassInstance部署在托管堆上(有點(diǎn)類似于數(shù)組的情形);
valueTypeLocalVariable是值類型局部變量,所以部署在棧上。
而對(duì)于值類型實(shí)例,即valueTypeStruct:
根據(jù)上下文,值類型實(shí)例valueTypeStructInstance本身是一個(gè)局部變量而不是字段,所以位于棧上; 其引用類型字段_referenceTypeField不存在跟隨的問(wèn)題,必然部署在托管堆上,并被一個(gè)引用所持有(該引用是valueTypeStruct的一部分,位于棧); 其引用類型局部變量referenceTypeLocalVariable顯然部署在托管堆上,并被一個(gè)位于棧的引用所持有。 所以,簡(jiǎn)單地說(shuō)“值類型存儲(chǔ)在棧上,引用類型存儲(chǔ)在托管堆上”是不對(duì)的。必須具體情況具體分析。
C#引用類型和值類型的區(qū)別——正確使用值類型和引用類型
這一部分主要參考《Effective C#》,并非本人原創(chuàng),希望能讓你加深對(duì)值類型和引用類型的理解。辨明值類型和引用類型的使用場(chǎng)合C#中,我們用struct/class來(lái)聲明一個(gè)類型為值類型/引用類型。
考慮下面的例子:
- TestType[] testTypes = new TestType[100];
如果TestTye是值類型,則只需要一次分配,大小為TestTye的100倍。而如果TestTye是引用類型,剛開(kāi)始需要100次分配,分配后數(shù)組的各元素值為null,然后再初始化100個(gè)元素,結(jié)果總共需要進(jìn)行101次分配。這將消耗更多的時(shí)間,造成更多的內(nèi)存碎片。所以,如果類型的職責(zé)主要是存儲(chǔ)數(shù)據(jù),值類型比較合適。
一般來(lái)說(shuō),值類型(不支持多態(tài))適合存儲(chǔ)供 C#應(yīng)用程序操作的數(shù)據(jù),而引用類型(支持多態(tài))應(yīng)該用于定義應(yīng)用程序的行為。
通常我們創(chuàng)建的引用類型總是多于值類型。如果以下問(wèn)題的回答都為yes,那么我們就應(yīng)該創(chuàng)建為值類型:
該類型的主要職責(zé)是否用于數(shù)據(jù)存儲(chǔ)? 該類型的共有借口是否完全由一些數(shù)據(jù)成員存取屬性定義? 是否確信該類型永遠(yuǎn)不可能有子類? 是否確信該類型永遠(yuǎn)不可能具有多態(tài)行為? 將值類型盡可能實(shí)現(xiàn)為具有常量性和原子性的類型
具有常量性的類型很簡(jiǎn)單:
如果構(gòu)造的時(shí)候驗(yàn)證了參數(shù)的有效性,之后就一直有效; 省去了許多錯(cuò)誤檢查,因?yàn)榻垢模?確保線程安全,因?yàn)槎鄠€(gè)reader訪問(wèn)到同樣的內(nèi)容; 可以安全地暴露給外界,因?yàn)檎{(diào)用者不能更改對(duì)象的內(nèi)部狀態(tài)。 具有原子性的類型都是單一的實(shí)體,我們通常會(huì)直接替換一個(gè)原子類型的整個(gè)內(nèi)容。
下面是一個(gè)典型的可變類型:
- public struct Address
- {
- private string _city;
- private string _province;
- private int _zipCode;
- public string City
- {
- get { return _city; }
- set { _city = value; }
- }
- public string Province
- {
- get { return _province; }
- set
- {
- ValidateProvince(value);
- _province = value;
- }
- }
- public int ZipCode
- {
- get { return _zipCode; }
- set
- {
- ValidateZipCode(value);
- _zipCode = value;
- }
- }
- }
下面創(chuàng)建一個(gè)實(shí)例:
- Address address = new Address();
- address.City = "Chengdu";
- address.Province = "Sichuan";
- address.ZipCode = 610000;
然后更改這個(gè)實(shí)例:
- address.City = "Nanjing"; //Now Province and ZipCode are invalid
- address.ZipCode = 210000; //Now Province is still invalid
- address.Province = "Jiangsu";
可見(jiàn),內(nèi)部狀態(tài)的改變意味著可能違反對(duì)象的不變式(invariant),至少是臨時(shí)的違反。如果上面是一個(gè)多線程的程序,那么在 City更改的過(guò)程中,另一個(gè)線程可能看到不一致的數(shù)據(jù)視圖。如果不是多線程的程序,也有問(wèn)題:
當(dāng)ZipCode的值無(wú)效而拋出異常時(shí),對(duì)象僅作了一部分改變,因此處于無(wú)效的狀態(tài),為了修復(fù)這個(gè)問(wèn)題,需要在Address中添加相當(dāng)多的內(nèi)部校驗(yàn)代碼;
為了實(shí)現(xiàn)異常安全,我們需要在所有改變多個(gè)字段的客戶代碼處放上防御性的代碼;
線程安全也要求我們?cè)诿恳粋€(gè)屬性的訪問(wèn)器上添加線程同步檢查。
顯然,這是一個(gè)相當(dāng)可觀的工作量。下面我們把Address實(shí)現(xiàn)為常量類型:
- public struct Address
- {
- private string _city;
- private string _province;
- private int _zipCode;
- public Address (string city, string province, int zipCode)
- {
- _city = city;
- _province = province;
- _zipCode = zipCode;
- ValidateProvince(province);
- ValidateZipCode(zipCode);
- }
- public string City
- {
- get { return _city; }
- }
- public string Province
- {
- get { return _province; }
- }
- public int ZipCode
- {
- get { return _zipCode; }
- }
- }
如果要改變Address,不能修改現(xiàn)有的實(shí)例,只能創(chuàng)建一個(gè)新的實(shí)例:
- Address address = new Address("Chengdu", "Sichuan", 610000);//create a instance
- address = new Address("Nanjing", "Jiangsu", 210000);//modify the instance
address將不存在任何無(wú)效的臨時(shí)狀態(tài)。那些臨時(shí)狀態(tài)只存在于Address的構(gòu)造函數(shù)執(zhí)行過(guò)程中。這樣一來(lái),Address是異常安全的,也是線程安全的。
確保0為值類型的有效狀態(tài)
.NET的默認(rèn)初始化機(jī)制會(huì)將引用類型設(shè)置為二進(jìn)制意義上的0,即null。而對(duì)于值類型,不論我們是否提供構(gòu)造函數(shù),都會(huì)有一個(gè)默認(rèn)的構(gòu)造函數(shù),將其設(shè)置為0。
一種典型的情況是枚舉:
- public enum Sex
- {
- Male = 1;
- Female = 2;
- }
然后用做值類型的成員:
- public struct Employee
- {
- private Sex _sex;
- //other
- }
創(chuàng)建Employee結(jié)構(gòu)體將得到一個(gè)無(wú)效的Sex字段:
- Employee employee = new Employee ();
employee的_sex是無(wú)效的,因?yàn)槠錇?。我們應(yīng)該將0作為一個(gè)為初始化的值明確表示出來(lái):
- public Sex
- {
- None = 0;
- Male = 1;
- Female = 2;
- }
如果值類型中包含引用類型,會(huì)出現(xiàn)另一種初始化問(wèn)題:
- public struct ErrorLog
- {
- private string _message;
- //other
- }
然后創(chuàng)建一個(gè)ErrorLog:
- ErrorLog errorLog = new ErrorLog ();
errorLog的_message字段將是一個(gè)空引用。我們應(yīng)該通過(guò)一個(gè)屬性來(lái)將_message暴露給客戶代碼,從而使該問(wèn)題限定在ErrorLog 的內(nèi)部:
- public struct ErrorLog
- {
- private string _message;
- public string Message
- {
- get
- {
- return (_message ! = null) ? _message : string.Empty;
- }
- set { _message = value; }
- }
- //other
- }
盡量減少裝箱和拆箱
裝箱指把一個(gè)值類型放入一個(gè)未具名類型的引用類型中,比如:
- int valueType = 0;
- object referenceType = i;//boxing
拆箱則是從前面的裝箱對(duì)象中取出值類型:
- object referenceType;
- int valueType = (int)referenceType;//unboxing
裝箱和拆箱是比較耗費(fèi)性能的,還會(huì)引入一些詭異的bug,我們應(yīng)當(dāng)避免裝箱和拆箱。
裝箱和拆箱***的問(wèn)題是會(huì)自動(dòng)發(fā)生。比如:
- Console.WriteLine("A few numbers: {0}, {1}.", 25, 32);
其中,Console.WriteLine()接收的參數(shù)類型是(string,object,object)。因此,實(shí)際上會(huì)執(zhí)行以下操作:
- int i = 25;
- obeject o = i;//boxing
然后把o傳給WriteLine()方法。在WriteLine()方法的內(nèi)部,為了調(diào)用i上的ToString()方法,又會(huì)執(zhí)行:
- int i = (int)o;//unboxing
- string output = i,ToString();
所以正確的做法應(yīng)該是:
- Console.WriteLine("A few numbers: {0}, {1}.", 25.ToString(), 32.ToString());
25.ToString()只是執(zhí)行一個(gè)方法并返回一個(gè)引用類型,不存在裝箱/拆箱的問(wèn)題。
另一個(gè)典型的例子是ArryList的使用:
- public struct Employee
- {
- private string _name;
- public Employee(string name)
- {
- _name = name;
- }
- public string Name
- {
- get { return _name; }
- set { _name = value; }
- }
- public override string ToString()
- {
- return _name;
- }
- }
- ArrayList employees = new ArrayList();
- employees.Add(new Employee("Old Name"));//boxing
- Employee ceo = (Employee)employees[0];//unboxing
- ceo.Name = "New Name";//employees[0].ToString() is still "Old Name"
上面的代碼不僅存在性能的問(wèn)題,還容易導(dǎo)致錯(cuò)誤發(fā)生。
在這種情況下,更好的做法是使用泛型集合:
- List< Employee> employees = new List< Employee>();
由于List< T>是強(qiáng)類型的集合,employees.Add()方法不進(jìn)行類型轉(zhuǎn)換,所以不存在裝箱/拆箱的問(wèn)題。
C#引用類型和值類型的區(qū)別——總結(jié)
C#中,變量是值還是引用僅取決于其數(shù)據(jù)類型。
C#的值類型包括:結(jié)構(gòu)體(數(shù)值類型,bool型,用戶定義的結(jié)構(gòu)體),枚舉,可空類型。
C#的引用類型包括:數(shù)組,用戶定義的類、接口、委托,object,字符串。
數(shù)組的元素,不管是引用類型還是值類型,都存儲(chǔ)在托管堆上。
引用類型在棧中存儲(chǔ)一個(gè)引用,其實(shí)際的存儲(chǔ)位置位于托管堆。為了方便,本文簡(jiǎn)稱引用類型部署在托管推上。
值類型總是分配在它聲明的地方:作為字段時(shí),跟隨其所屬的變量(實(shí)例)存儲(chǔ);作為局部變量時(shí),存儲(chǔ)在棧上。
值類型在內(nèi)存管理方面具有更好的效率,并且不支持多態(tài),適合用作存儲(chǔ)數(shù)據(jù)的載體;引用類型支持多態(tài),適合用于定義應(yīng)用程序的行為。
應(yīng)該盡可能地將值類型實(shí)現(xiàn)為具有常量性和原子性的類型。
應(yīng)該盡可能地確保0為值類型的有效狀態(tài)。
應(yīng)該盡可能地減少裝箱和拆箱。
關(guān)鍵字new將在托管堆上分配內(nèi)存空間,并返回一個(gè)該內(nèi)存空間的地址。左邊的reference位于棧上,是一個(gè)引用,存儲(chǔ)著一個(gè)內(nèi)存地址;而這個(gè)地址指向的內(nèi)存(位于托管堆)里存儲(chǔ)著其內(nèi)容(一個(gè)System.Object的實(shí)例)。
【編輯推薦】