深入探討C#foreach語句
C# foreach語句不僅僅只是do...while或者for循環(huán)語句的一個(gè)變體。它會(huì)為我們的集合產(chǎn)生***的遍歷代碼。實(shí)際上,foreach語句的定義和.NET框架中的集合接口密切相關(guān)。對于一些特殊的集合類型,C#編譯器會(huì)產(chǎn)生具有***效率的代碼。遍歷集合時(shí),我們應(yīng)該使用C# foreach語句,而非其他的循環(huán)構(gòu)造。例如,對于下面三種循環(huán):
- int [] foo = new int[100];
- // 循環(huán)1:
- foreach ( int i in foo)
- Console.WriteLine( i.ToString( ));
- // 循環(huán)2:
- for ( int index = 0;
- index < foo.Length;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
- // 循環(huán)3:
- int len = foo.Length;
- for ( int index = 0;
- index < len;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
對于當(dāng)前和將來的C#編譯器(版本1.1及其以上版本),第1個(gè)循環(huán)產(chǎn)生的代碼***,而且需要鍵入的字符也最少,因此程序員的開發(fā)效率也比較高。(不過在C# 1.0編譯器下,第1個(gè)循環(huán)產(chǎn)生的代碼效率較慢,第2個(gè)循環(huán)產(chǎn)生的代碼效率***。)大多數(shù)C和C++程序員認(rèn)為效率***的第3循環(huán),反而是最壞的選擇。通過將Length變量放到循環(huán)之外,我們實(shí)際上阻礙了JIT編譯器移除循環(huán)中的范圍檢查。
C#代碼運(yùn)行在一個(gè)安全、托管的環(huán)境中。每一個(gè)內(nèi)存位置都會(huì)被檢查,包括數(shù)組索引。事實(shí)上,第3個(gè)循環(huán)所產(chǎn)生的代碼和如下的代碼等效:
- // 循環(huán)3, 和編譯器產(chǎn)生的代碼等效:
- int len = foo.Length;
- for ( int index = 0;
- index < len;
- index++ )
- {
- if ( index < foo.Length )
- Console.WriteLine( foo[index].ToString( ));
- else
- throw new IndexOutOfRangeException( );
- }
JIT和C#編譯器并不“喜歡”我們用這種方式來幫助它們。將Length屬性放到循環(huán)之外只會(huì)讓JIT編譯器做更多的工作,產(chǎn)生的代碼也更慢。CLR會(huì)確保我們寫的代碼不會(huì)濫用變量擁有的內(nèi)存。CLR會(huì)在訪問每一個(gè)特定數(shù)組元素之前,產(chǎn)生一個(gè)數(shù)組界限(并非上面的len變量)測試。如果我們像上面那樣寫代碼,每一個(gè)數(shù)組界限測試會(huì)被執(zhí)行兩次。
在循環(huán)的每一次迭代中,我們都要對數(shù)組索引做兩次檢查。第1個(gè)循環(huán)和第2個(gè)循環(huán)更快的理由在于C#編譯器和JIT編譯器可以確保循環(huán)中的數(shù)組界限是安全的。只要循環(huán)變量不是數(shù)組的Length屬性,每一次迭代時(shí)都會(huì)執(zhí)行數(shù)組界限檢查。
對于1.0版本的C#編譯器,在數(shù)組上使用foreach語句產(chǎn)生的代碼比較慢的原因在于裝箱操作(有關(guān)裝箱的詳細(xì)討論,參見條款17)。在.NET中,數(shù)組是類型安全的。1.1版本之后的C#編譯器會(huì)為數(shù)組與其他集合產(chǎn)生不同的IL。在1.0版本的編譯器產(chǎn)生的代碼中,在數(shù)組上使用foreach語句實(shí)際上是通過IEnumerator接口來遍歷數(shù)組,而這會(huì)導(dǎo)致裝箱與拆箱操作:
- IEnumerator it = foo.GetEnumerator( );
- while( it.MoveNext( ))
- {
- int i = (int) it.Current; // 這里將出現(xiàn)裝箱和拆箱。
- Console.WriteLine( i.ToString( ) );
- }
相反,對于1.1版本之后的C#編譯器,在數(shù)組上使用foreach語句將產(chǎn)生類似如下的構(gòu)造:
- for ( int index = 0;
- index < foo.Length;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
由于foreach語句總會(huì)產(chǎn)生***的代碼,所以我們不必刻意去記憶哪種構(gòu)造會(huì)產(chǎn)生***效的循環(huán)構(gòu)造——foreach和編譯器會(huì)為我們做這些工作。
如果效率還不能說服大家,那么來看看語言互操作的情況??傆幸恍┤耍ㄆ渲械拇蠖鄶?shù)人都有使用其他一些編程語言的經(jīng)驗(yàn))堅(jiān)定地認(rèn)為數(shù)組的起始索引變量應(yīng)該從1(而非0)開始。不管我們怎么費(fèi)力地說服他們,都無法改變他們的這個(gè)習(xí)慣。.NET開發(fā)組在這個(gè)問題上已經(jīng)盡力了。我們可以在C#語言中用如下的初始化方式,來獲得一個(gè)起始索引不為0的數(shù)組:
- // 創(chuàng)建一個(gè)一維數(shù)組,范圍為 [ 1 .. 5 ]。
- Array test = Array.CreateInstance( typeof( int ),
- new int[ ]{ 5 }, new int[ ]{ 1 });
很多人面對這樣的代碼可能會(huì)退縮,轉(zhuǎn)而使用起始索引為0的數(shù)組。但是總有一些人對此比較頑固。不管你怎么努力,這些人都會(huì)堅(jiān)持從1開始索引數(shù)組。幸運(yùn)地是,在這個(gè)問題上我們可以使用foreach語句來蒙混編譯器:
- foreach( int j in test )
- Console.WriteLine ( j );
這里的foreach語句知道如何獲得數(shù)組的上下界,因此就不必?zé)﹦谖覀儭移湫屎臀覀兪謱懙膄or循環(huán)一樣快,不管其他人采用的數(shù)組下界是多少,我們使用這種做法都可以正常工作。
另外,C# foreach語句還可以為我們帶來其他好處。其中的循環(huán)變量是只讀的——也就是說我們不能替換foreach語句中的集合對象。而且還存在一個(gè)顯式強(qiáng)制轉(zhuǎn)型。如果集合中保存的對象類型不正確,迭代語句將拋出一個(gè)異常。
對于多維數(shù)組,foreach語句也有類似的好處。假設(shè)我們要?jiǎng)?chuàng)建一個(gè)棋盤,我們可能會(huì)編寫如下的兩段代碼:
- private Square[,] _theBoard = new Square[ 8, 8 ];
- // 另外地方的代碼:
- for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )
- for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )
- _theBoard[ i, j ].PaintSquare( );
使用foreach語句,我們可以將上面的遍歷代碼做如下的簡化:
- foreach( Square sq in _theBoard )
- sq.PaintSquare( );
不管數(shù)組的維數(shù)是多少,foreach語句都會(huì)產(chǎn)生正確的遍歷代碼。如果我們之后又要做一個(gè)3D棋盤,上面的foreach循環(huán)仍然會(huì)正常工作。而其他手寫的循環(huán)代碼就需要更改了:
- for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )
- for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )
- for( int k = 0; k < _theBoard.GetLength( 2 ); k++ )
- _theBoard[ i, j, k ].PaintSquare( );
事實(shí)上,對于在每一維上擁有不同下界的多維數(shù)組來講,foreach循環(huán)也會(huì)正常工作。這里我就不再編寫這樣的示例代碼了。如果有人使用那樣的集合,我們要知道foreach語句也能處理它。
如果我們剛開始使用的是數(shù)組,后來又需要轉(zhuǎn)向其他數(shù)據(jù)結(jié)構(gòu),foreach語句允許我們不用更改絕大多數(shù)代碼,從而保持代碼的靈活性。假設(shè)我們剛開始有如下一個(gè)簡單的數(shù)組:
- int [] foo = new int[100];
但過了一段時(shí)間后,我們發(fā)現(xiàn)該數(shù)組無法方便地處理我們需要的某種功能。這時(shí)候,我們選擇將數(shù)組更改為ArrayList:
- // 設(shè)置初始大小:
- ArrayList foo = new ArrayList( 100 );
這樣更改之后,任何手寫的for循環(huán)代碼都將遭到破壞:
- int sum = 0;
- for ( int index = 0;
- // 下面的代碼將不能編譯:ArrayList 使用Count,而非Length。
- index < foo.Length;
- index++ )
- //下面的代碼將不能編譯:foo[ index ] 是一個(gè)object,而非int。
- sum += foo[ index ];
而使用foreach語句,它會(huì)編譯為不同的代碼,自動(dòng)將每一個(gè)操作數(shù)強(qiáng)制轉(zhuǎn)換為正確的類型。我們在代碼上無需做任何更改。事實(shí)上,使用foreach語句不僅可以更改為標(biāo)準(zhǔn)集合類型——任何集合類型都可以使用foreach。
如果我們支持.NET環(huán)境為集合所定義的規(guī)則,用戶便可以使用foreach來遍歷我們的類型成員。要讓foreach語句將一個(gè)類看做集合類型,該類必須擁有一些屬性。總共有3種方式可以使一個(gè)類成為集合類:類型具備一個(gè)公有的GetEnumerator()方法;類型顯式實(shí)現(xiàn)了IEnumerable接口;類型實(shí)現(xiàn)了IEnumerator接口。
***,C# foreach語句還會(huì)為我們在資源管理方面帶來額外的好處。IEnumerable接口只包含一個(gè)方法:GetEnumerator()。在一個(gè)支持IEnumerable接口的類型上使用foreach語句會(huì)產(chǎn)生類似如下的代碼(會(huì)有一些優(yōu)化):
- IEnumerator it = foo.GetEnumerator( ) as IEnumerator;
- using ( IDisposable disp = it as IDisposable )
- {
- while ( it.MoveNext( ))
- {
- int elem = ( int ) it.Current;
- sum += elem;
- }
- }
如果編譯器可以確定類型對IDisposable接口的實(shí)現(xiàn)情況,那么它就會(huì)自動(dòng)優(yōu)化finally塊中的語句。
綜上所述,foreach是一個(gè)非常有用的語句。它會(huì)使用***效的構(gòu)造為“數(shù)組的上下界索引”、“多維數(shù)組遍歷”和“操作數(shù)轉(zhuǎn)型”產(chǎn)生正確的代碼,并且產(chǎn)生的是***效率的循環(huán)結(jié)構(gòu)。它是遍歷集合的***方式。使用它,我們編寫的代碼將比較“經(jīng)久耐用”,而且在剛開始編寫的時(shí)候也比較簡單。使用foreach為我們帶來的開發(fā)效率提升可能很少,但是隨著時(shí)間的推移,它的效益會(huì)不斷增長。
C# foreach語句的深入了解的內(nèi)容就向你介紹到這里,希望對你了解和學(xué)習(xí)C# foreach語句有所幫助。
【編輯推薦】