STL組件之迭代器
STL的一個重要特點是數(shù)據(jù)結(jié)構(gòu)和算法的分離。盡管這是個簡單的概念,但這種分離確實使得STL變得非常通用。例如,由于STL的sort()函數(shù)是完全通用的,你可以用它來操作幾乎任何數(shù)據(jù)集合,包括鏈表,容器和數(shù)組。
要點
STL算法作為模板函數(shù)提供。為了和其他組件相區(qū)別,在本書中STL算法以后接一對圓括弧的方式表示,例如sort()。
STL 另一個重要特性是它不是面向?qū)ο蟮?。為了具有足夠通用性,STL主要依賴于模板而不是封裝,繼承和虛函數(shù)(多態(tài)性)——OOP的三個要素。你在STL中找不到任何明顯的類繼承關(guān)系。這好像是一種倒退,但這正好是使得STL的組件具有廣泛通用性的底層特征。另外,由于STL是基于模板,內(nèi)聯(lián)函數(shù)的使用使得生成的代碼短小高效。
提示
確保在編譯使用了STL的程序中至少要使用-O優(yōu)化來保證內(nèi)聯(lián)擴展。
STL組件
STL提供了大量的模板類和函數(shù),可以在OOP和常規(guī)編程中使用。所有的STL的大約50個算法都是完全通用的,而且不依賴于任何特定的數(shù)據(jù)類型。下面的小節(jié)說明了三個基本的STL組件:
1)迭代器提供了訪問容器中對象的方法。例如,可以使用一對迭代器指定list或vector中的一定范圍的對象。迭代器就如同一個指針。事實上,C++的指針也是一種迭代器。但是,迭代器也可以是那些定義了operator*()以及其他類似于指針的操作符地方法的類對象。
2)容器是一種數(shù)據(jù)結(jié)構(gòu),如list,vector,和deques ,以模板類的方法提供。為了訪問容器中的數(shù)據(jù),可以使用由容器類輸出的迭代器。
3)算法是用來操作容器中的數(shù)據(jù)的模板函數(shù)。例如,STL用sort()來對一個vector中的數(shù)據(jù)進行排序,用find()來搜索一個list中的對象。函數(shù)本身與他們操作的數(shù)據(jù)的結(jié)構(gòu)和類型無關(guān),因此他們可以在從簡單數(shù)組到高度復(fù)雜容器的任何數(shù)據(jù)結(jié)構(gòu)上使用。
1、頭文件
為了避免和其他頭文件沖突, STL的頭文件不再使用常規(guī)的.h擴展。為了包含標(biāo)準(zhǔn)的string類,迭代器和算法,用下面的指示符:
- #include <string>
- #include <iterator>
- #include <algorithm>
如果你查看STL的頭文件,你可以看到象iterator.h和stl_iterator.h這樣的頭文件。由于這些名字在各種STL實現(xiàn)之間都可能不同,你應(yīng)該避免使用這些名字來引用這些頭文件。為了確保可移植性,使用相應(yīng)的沒有.h后綴的文件名。
2、名字空間
你的編譯器可能不能識別名字空間。名字空間就好像一個信封,將標(biāo)志符封裝在另一個名字中。標(biāo)志符只在名字空間中存在,因而避免了和其他標(biāo)志符沖突。例如,可能有其他庫和程序模塊定義了sort()函數(shù),為了避免和STL地sort()算法沖突,STL的sort()以及其他標(biāo)志符都封裝在名字空間std中。 STL的sort()算法編譯為std::sort(),從而避免了名字沖突。
盡管你的編譯器可能沒有實現(xiàn)名字空間,你仍然可以使用他們。為了使用STL,可以將下面的指示符插入到你的源代碼文件中,典型地是在所有的#include指示符的后面:
- using namespace std;
#p#
3、迭代器
迭代器提供對一個容器中的對象的訪問方法,并且定義了容器中對象的范圍。迭代器就如同一個指針。事實上,C++的指針也是一種迭代器。但是,迭代器不僅僅是指針,因此你不能認(rèn)為他們一定具有地址值。例如,一個數(shù)組索引,也可以認(rèn)為是一種迭代器。
迭代器有各種不同的創(chuàng)建方法。程序可能把迭代器作為一個變量創(chuàng)建。一個STL容器類可能為了使用一個特定類型的數(shù)據(jù)而創(chuàng)建一個迭代器。作為指針,必須能夠使用*操作符類獲取數(shù)據(jù)。你還可以使用其他數(shù)學(xué)操作符如++。典型的,++操作符用來遞增迭代器,以訪問容器中的下一個對象。如果迭代器到達了容器中的***一個元素的后面,則迭代器變成past-the-end值。使用一個past-the-end值得指針來訪問對象是非法的,就好像使用NULL或為初始化的指針一樣。
(1)提示
STL不保證可以從另一個迭代器來抵達一個迭代器。例如,當(dāng)對一個集合中的對象排序時,如果你在不同的結(jié)構(gòu)中指定了兩個迭代器,第二個迭代器無法從***個迭代器抵達,此時程序注定要失敗。這是STL靈活性的一個代價。STL不保證檢測毫無道理的錯誤。
(2)迭代器的類型
對于STL數(shù)據(jù)結(jié)構(gòu)和算法,你可以使用五種迭代器。下面簡要說明了這五種類型:
- Input iterators 提供對數(shù)據(jù)的只讀訪問。
- Output iterators 提供對數(shù)據(jù)的只寫訪問
- Forward iterators 提供讀寫操作,并能向前推進迭代器。
- Bidirectional iterators提供讀寫操作,并能向前和向后操作。
- Random access iterators提供讀寫操作,并能在數(shù)據(jù)中隨機移動。
盡管各種不同的STL實現(xiàn)細(xì)節(jié)方面有所不同,還是可以將上面的迭代器想象為一種類繼承關(guān)系。從這個意義上說,下面的迭代器繼承自上面的迭代器。由于這種繼承關(guān)系,你可以將一個Forward迭代器作為一個output或input迭代器使用。同樣,如果一個算法要求是一個bidirectional 迭代器,那么只能使用該種類型和隨機訪問迭代器。
指針迭代器
正如下面的小程序顯示的,一個指針也是一種迭代器。該程序同樣顯示了 STL的一個主要特性——它不只是能夠用于它自己的類類型,而且也能用于任何C或C++類型。Listing 1, iterdemo.cpp, 顯示了如何把指針作為迭代器用于STL的find()算法來搜索普通的數(shù)組。
表 1. iterdemo.cpp
- #include <iostream.h>
- #include <algorithm>
- using namespace std;
- #define SIZE 100
- int iarray[SIZE];
- int main()
- {
- iarray[20] = 50;
- int* ip = find(iarray, iarray + SIZE, 50);
- if (ip == iarray + SIZE)
- cout << "50 not found in array" << endl;
- else
- cout << *ip << " found in array" << endl;
- return 0;
- }
在引用了I/O流庫和STL算法頭文件(注意沒有.h后綴),該程序告訴編譯器使用std名字空間。使用std名字空間的這行是可選的,因為可以刪除該行對于這么一個小程序來說不會導(dǎo)致名字沖突。
程序中定義了尺寸為SIZE的全局?jǐn)?shù)組。由于是全局變量,所以運行時數(shù)組自動初始化為零。下面的語句將在索引20位置處地元素設(shè)置為50,并使用find()算法來搜索值50:
- iarray[20] = 50;
- int* ip = find(iarray, iarray + SIZE, 50);
find() 函數(shù)接受三個參數(shù)。頭兩個定義了搜索的范圍。由于C和C++數(shù)組等同于指針,表達式iarray指向數(shù)組的***個元素。而第二個參數(shù)iarray + SIZE等同于past-the-end 值,也就是數(shù)組中***一個元素的后面位置。第三個參數(shù)是待定位的值,也就是50。find()函數(shù)返回和前兩個參數(shù)相同類型的迭代器,這兒是一個指向整數(shù)的指針ip。
提示
必須記住STL使用模板。因此,STL函數(shù)自動根據(jù)它們使用的數(shù)據(jù)類型來構(gòu)造。
為了判斷find()是否成功,例子中測試ip和 past-the-end 值是否相等:
- if (ip == iarray + SIZE)
如果表達式為真,則表示在搜索的范圍內(nèi)沒有指定的值。否則就是指向一個合法對象的指針,這時可以用下面的語句顯示::
- cout << *ip << " found in array" << endl;
測試函數(shù)返回值和NULL是否相等是不正確的。不要象下面這樣使用:
- int* ip = find(iarray, iarray + SIZE, 50);
- if (ip != NULL) ... // ??? incorrect
當(dāng)使用STL函數(shù)時,只能測試ip是否和past-the-end 值是否相等。盡管在本例中ip是一個C++指針,其用法也必須符合STL迭代器的規(guī)則。
#p#
容器迭代器
盡管C++指針也是迭代器,但用的更多的是容器迭代器。容器迭代器用法和iterdemo.cpp一樣,但和將迭代器申明為指針變量不同的是,你可以使用容器類方法來獲取迭代器對象。兩個典型的容器類方法是begin()和end()。它們在大多數(shù)容器中表示整個容器范圍。其他一些容器還使用 rbegin()和rend()方法提供反向迭代器,以按反向順序指定對象范圍。
下面的程序創(chuàng)建了一個矢量容器(STL的和數(shù)組等價的對象),并使用迭代器在其中搜索。該程序和前一章中的程序相同。
Listing 2. vectdemo.cpp
- #include <iostream.h>
- #include <algorithm>
- #include <vector>
- using namespace std;
- vector<int> intVector(100);
- void main()
- {
- intVector[20] = 50;
- vector<int>::iterator intIter =
- find(intVector.begin(), intVector.end(), 50);
- if (intIter != intVector.end())
- cout << "Vector contains value " << *intIter << endl;
- else
- cout << "Vector does not contain 50" << endl;
- }
注意用下面的方法顯示搜索到的數(shù)據(jù):
- cout << "Vector contains value " << *intIter << endl;
常量迭代器
和指針一樣,你可以給一個迭代器賦值。例如,首先申明一個迭代器:
- vector<int>::iterator first;
該語句創(chuàng)建了一個vector<int>類的迭代器。下面的語句將該迭代器設(shè)置到intVector的***個對象,并將它指向的對象值設(shè)置為123:
- first = intVector.begin();
- *first = 123;
這種賦值對于大多數(shù)容器類都是允許的,除了只讀變量。為了防止錯誤賦值,可以申明迭代器為:
- const vector<int>::iterator result;
- result = find(intVector.begin(), intVector.end(), value);
- if (result != intVector.end())
- *result = 123; // ???
警告
另一種防止數(shù)據(jù)被改變得方法是將容器申明為const類型。
『呀!在VC中測試出錯,正確的含義是result成為常量而不是它指向的對象不允許改變,如同int *const p;看來這作者自己也不懂』
使用迭代器編程
你已經(jīng)見到了迭代器的一些例子,現(xiàn)在我們將關(guān)注每種特定的迭代器如何使用。由于使用迭代器需要關(guān)于STL容器類和算法的知識,在閱讀了后面的兩章后你可能需要重新復(fù)習(xí)一下本章內(nèi)容。
#p#
輸入迭代器
輸入迭代器是最普通的類型。輸入迭代器至少能夠使用==和!=測試是否相等;使用*來訪問數(shù)據(jù);使用++操作來遞推迭代器到下一個元素或到達past-the-end 值。
為了理解迭代器和STL函數(shù)是如何使用它們的,現(xiàn)在來看一下find()模板函數(shù)的定義:
- template <class InputIterator, class T>
- InputIterator find(
- InputIterator first, InputIterator last, const T& value) {
- while (first != last && *first != value) ++first;
- return first;
- }
注意
在find()算法中,注意如果first和last指向不同的容器,該算法可能陷入死循環(huán)。
輸出迭代器
輸出迭代器缺省只寫,通常用于將數(shù)據(jù)從一個位置拷貝到另一個位置。由于輸出迭代器無法讀取對象,因此你不會在任何搜索和其他算法中使用它。要想讀取一個拷貝的值,必須使用另一個輸入迭代器(或它的繼承迭代器)。
Listing 3. outiter.cpp
- #include <iostream.h>
- #include <algorithm> // Need copy()
- #include <vector> // Need vector
- using namespace std;
- double darray[10] =
- {1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9};
- vector<double> vdouble(10);
- int main()
- {
- vector<double>::iterator utputIterator = vdouble.begin();
- copy(darray, darray + 10, outputIterator);
- while (outputIterator != vdouble.end()) {
- cout << *outputIterator << endl;
- outputIterator++;
- }
- return 0;
- }
注意
當(dāng)使用copy()算法的時候,你必須確保目標(biāo)容器有足夠大的空間,或者容器本身是自動擴展的。
#p#
前推迭代器
前推迭代器能夠讀寫數(shù)據(jù)值,并能夠向前推進到下一個值。但是沒法遞減。replace()算法顯示了前推迭代器的使用方法。
- template <class ForwardIterator, class T>
- void replace (ForwardIterator first,
- ForwardIterator last,
- const T& old_value,
- const T& new_value);
使用replace()將[first,last]范圍內(nèi)的所有值為old_value的對象替換為new_value。:
- replace(vdouble.begin(), vdouble.end(), 1.5, 3.14159);
雙向迭代器
雙向迭代器要求能夠增減。如reverse()算法要求兩個雙向迭代器作為參數(shù):
- template <class BidirectionalIterator>
- void reverse (BidirectionalIterator first,
- BidirectionalIterator last);
使用reverse()函數(shù)來對容器進行逆向排序:
- reverse(vdouble.begin(), vdouble.end());
隨機訪問迭代器
隨機訪問迭代器能夠以任意順序訪問數(shù)據(jù),并能用于讀寫數(shù)據(jù)(不是const的C++指針也是隨機訪問迭代器)。STL的排序和搜索函數(shù)使用隨機訪問迭代器。隨機訪問迭代器可以使用關(guān)系操作符作比較。
random_shuffle() 函數(shù)隨機打亂原先的順序。申明為:
- template <class RandomAccessIterator>
- void random_shuffle (RandomAccessIterator first,
- RandomAccessIterator last);
使用方法:
- random_shuffle(vdouble.begin(), vdouble.end());
迭代器技術(shù)
要學(xué)會使用迭代器和容器以及算法,需要學(xué)習(xí)下面的新技術(shù)。
流和迭代器
本書的很多例子程序使用I/O流語句來讀寫數(shù)據(jù)。例如:
- int value;
- cout << "Enter value: ";
- cin >> value;
- cout << "You entered " << value << endl;
對于迭代器,有另一種方法使用流和標(biāo)準(zhǔn)函數(shù)。理解的要點是將輸入/輸出流作為容器看待。因此,任何接受迭代器參數(shù)的算法都可以和流一起工作。
Listing 4. outstrm.cpp
- #include <iostream.h>
- #include <stdlib.h> // Need random(), srandom()
- #include <time.h> // Need time()
- #include <algorithm> // Need sort(), copy()
- #include <vector> // Need vector
- using namespace std;
- void Display(vector<int>& v, const char* s);
- int main()
- {
- // Seed the random number generator
- srandom( time(NULL) );
- // Construct vector and fill with random integer values
- vector<int> collection(10);
- for (int i = 0; i < 10; i++)
- collection[i] = random() % 10000;;
- // Display, sort, and redisplay
- Display(collection, "Before sorting");
- sort(collection.begin(), collection.end());
- Display(collection, "After sorting");
- return 0;
- }
- // Display label s and contents of integer vector v
- void Display(vector<int>& v, const char* s)
- {
- cout << endl << s << endl;
- copy(v.begin(), v.end(),
- ostream_iterator<int>(cout, "\t"));
- cout << endl;
- }
函數(shù)Display()顯示了如何使用一個輸出流迭代器。下面的語句將容器中的值傳輸?shù)絚out輸出流對象中:
- copy(v.begin(), v.end(),
- ostream_iterator<int>(cout, "\t"));
第三個參數(shù)實例化了ostream_iterator<int>類型,并將它作為copy()函數(shù)的輸出目標(biāo)迭代器對象。“\t”字符串是作為分隔符。運行結(jié)果:
- $ g++ outstrm.cpp
- $ ./a.out
- Before sorting
- 677 722 686 238 964 397 251 118 11 312
- After sorting
- 11 118 238 251 312 397 677 686 722 964
這是STL神奇的一面『確實神奇』。為定義輸出流迭代器,STL提供了模板類ostream_iterator。這個類的構(gòu)造函數(shù)有兩個參數(shù):一個ostream對象和一個string值。因此可以象下面一樣簡單地創(chuàng)建一個迭代器對象:
- ostream_iterator<int>(cout, "\n")
該迭代起可以和任何接受一個輸出迭代器的函數(shù)一起使用。
插入迭代器
插入迭代器用于將值插入到容器中。它們也叫做適配器,因為它們將容器適配或轉(zhuǎn)化為一個迭代器,并用于copy()這樣的算法中。例如,一個程序定義了一個鏈表和一個矢量容器:
- list<double> dList;
- vector<double> dVector;
通過使用front_inserter迭代器對象,可以只用單個copy()語句就完成將矢量中的對象插入到鏈表前端的操作:
- copy(dVector.begin(), dVector.end(), front_inserter(dList));
三種插入迭代器如下:
- 普通插入器 將對象插入到容器任何對象的前面。
- Front inserters 將對象插入到數(shù)據(jù)集的前面——例如,鏈表表頭。
- Back inserters 將對象插入到集合的尾部——例如,矢量的尾部,導(dǎo)致矢量容器擴展。
使用插入迭代器可能導(dǎo)致容器中的其他對象移動位置,因而使得現(xiàn)存的迭代器非法。例如,將一個對象插入到矢量容器將導(dǎo)致其他值移動位置以騰出空間。一般來說,插入到象鏈表這樣的結(jié)構(gòu)中更為有效,因為它們不會導(dǎo)致其他對象移動。
Listing 5. insert.cpp
- #include <iostream.h>
- #include <algorithm>
- #include <list>
- using namespace std;
- int iArray[5] = { 1, 2, 3, 4, 5 };
- void Display(list<int>& v, const char* s);
- int main()
- {
- list<int> iList;
- // Copy iArray backwards into iList
- copy(iArray, iArray + 5, front_inserter(iList));
- Display(iList, "Before find and copy");
- // Locate value 3 in iList
- list<int>::iterator p =
- find(iList.begin(), iList.end(), 3);
- // Copy first two iArray values to iList ahead of p
- copy(iArray, iArray + 2, inserter(iList, p));
- Display(iList, "After find and copy");
- return 0;
- }
- void Display(list<int>& a, const char* s)
- {
- cout << s << endl;
- copy(a.begin(), a.end(),
- ostream_iterator<int>(cout, " "));
- cout << endl;
- }
運行結(jié)果如下:
- $ g++ insert.cpp
- $ ./a.out
- Before find and copy
- 5 4 3 2 1
- After find and copy
- 5 4 1 2 3 2 1
可以將front_inserter替換為back_inserter試試。
如果用find()去查找在列表中不存在的值,例如99。由于這時將p設(shè)置為past-the-end 值。***的copy()函數(shù)將iArray的值附加到鏈表的后部。
混合迭代器函數(shù)
在涉及到容器和算法的操作中,還有兩個迭代器函數(shù)非常有用:
- advance() 按指定的數(shù)目增減迭代器。
- distance() 返回到達一個迭代器所需(遞增)操作的數(shù)目。
例如:
- list<int> iList;
- list<int>::iterator p =
- find(iList.begin(), iList.end(), 2);
- cout << "before: p == " << *p << endl;
- advance(p, 2); // same as p = p + 2;
- cout << "after : p == " << *p << endl;
- int k = 0;
- distance(p, iList.end(), k);
- cout << "k == " << k << endl;
advance()函數(shù)接受兩個參數(shù)。第二個參數(shù)是向前推進的數(shù)目。對于前推迭代器,該值必須為正,而對于雙向迭代器和隨機訪問迭代器,該值可以為負(fù)。
使用 distance()函數(shù)來返回到達另一個迭代器所需要的步驟。
注意:distance()函數(shù)是迭代的,也就是說,它遞增第三個參數(shù)。因此,你必須初始化該參數(shù)。未初始化該參數(shù)幾乎注定要失敗。
希望通過本文的介紹,能夠給你幫助。