經(jīng)典四講貫通C++排序之四 選擇排序
我們都知道C++排序方法中,有四種常用方法插入排序、希爾排序、交換排序以及選擇排序。這篇文章我們介紹選擇排序。(本系列文章統(tǒng)一 測(cè)試程序)
選擇排序
基本思想是:每次選出第i小的記錄,放在第i個(gè)位置(i的起點(diǎn)是0,按此說(shuō)法,第0小的記錄實(shí)際上就是最小的,有點(diǎn)別扭,不管這么多了)。當(dāng)i=N-1時(shí)就排完了。
直接選擇排序
直選排序簡(jiǎn)單的再現(xiàn)了選擇排序的基本思想,***次尋找最小元素的代價(jià)是O(n),如果不做某種特殊處理,每次都使用最簡(jiǎn)單的尋找方法,自然的整個(gè)排序的時(shí)間復(fù)雜度就是O(n2)了。
- template <class T>
- void SelectSort(T a[], int N, int& KCN, int& RMN)
- {
- KCN = 0; RMN = 0;
- for (int i = 0; i < N; i++)
- {
- for (int j = i + 1, k = i; j < N; j++) if (++KCN && a[j] < a[k]) k = j;//select min
- if (k != i) { swap(a[k], a[i]); RMN += 3; }
- }
- }
測(cè)試結(jié)果:
- Sort ascending N=10000 TimeSpared: 721ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=0 RMN/N=0 RMN/N^2=0 RMN/NlogN=0
- Sort randomness N=10000 TimeSpared: 711ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=29955 RMN/N=2.9955 RMN/N^2=0.00029955 RMN/NlogN=0.225434
- Sort descending N=10000 TimeSpared: 711ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=15000 RMN/N=1.5 RMN/N^2=0.00015 RMN/NlogN=0.112886
可以看到KCN固定為n(n-1)/2。另外一件有趣的事是,RMN=0的正序花的時(shí)間居然比RMN接近3(n-1)的亂序還多。一是說(shuō)明測(cè)試精度不夠,在我的機(jī)器上多次測(cè)試結(jié)果上下浮動(dòng)10ms是常有的事;二是說(shuō)明和KCN的n(n-1)/2相比,RMN的3(n-1)有些微不足道。
#p#
錦標(biāo)排序
從直選排序看來(lái),算法的瓶頸在于KCN,而實(shí)際上,對(duì)于后續(xù)的尋找最小值來(lái)說(shuō),時(shí)間復(fù)雜度可以降到O(logn)。最為直接的做法是采用錦標(biāo)賽的辦法,將冠軍拿走之后,只要把冠軍打過(guò)的比賽重賽一遍,那么剩下的人中的“冠軍”就產(chǎn)生了,而重賽的次數(shù)就是競(jìng)賽樹(shù)的深度。實(shí)際寫(xiě)的時(shí)候,弄不好就會(huì)寫(xiě)得很“蠢”,不只多余占用了大量?jī)?nèi)存,還會(huì)導(dǎo)致無(wú)用的判斷。我沒(méi)見(jiàn)過(guò)讓人滿意的例程(殷版上的實(shí)在太惡心了),自己又寫(xiě)不出來(lái)漂亮的,也就不獻(xiàn)丑了(其實(shí)這是惰性的緣故,有了快排之后,大多數(shù)人都不會(huì)對(duì)其他內(nèi)排感興趣,除了基數(shù)排序)。實(shí)在無(wú)聊的時(shí)候,不妨寫(xiě)(或者改進(jìn))錦標(biāo)排序來(lái)打發(fā)時(shí)間,^_^。
堆排序
錦標(biāo)排序的附加儲(chǔ)存太多了,而高效的尋找***值或最小值(O(logn)),我們還有一種方法是堆。這里使用了***堆,用待排記錄的空間充當(dāng)堆空間,將堆頂?shù)挠涗?目前***)和堆的***一個(gè)記錄交換,當(dāng)堆逐漸縮小成1的時(shí)候,記錄就排序完成了。顯而易見(jiàn)的,時(shí)間復(fù)雜度為O(nlogn),并且沒(méi)有很糟的情況。
- template <class T>
- void FilterDown(T a[], int i, int N, int& KCN, int& RMN)
- {
- int child = 2 * i + 1; T temp = a[i];
- while (child < N)
- {
- if (child < N - 1 && a[child] < a[child+1]) child++;
- if (++KCN && temp >= a[child]) break;//不需調(diào)整,結(jié)束調(diào)整
- a[i] = a[child]; RMN++;
- i = child; child = 2 * i + 1;
- }
- a[i] = temp; RMN++;
- }
- template <class T>
- void HeapSort(T a[], int N, int& KCN, int& RMN)
- {
- int i;
- for (i = (N - 2)/2; i >= 0; i--) FilterDown
(a, i, N, KCN, RMN); //生成***堆- for (i = N - 1; i > 0; i--)
- {
- swap(a[0], a[i]); RMN += 3;
- FilterDown(a, 0, i, KCN, RMN);
- }
- }
測(cè)試結(jié)果,直接測(cè)試的是N=100000:
- Sort ascending N=100000 TimeSpared: 110ms
- KCN=1556441 KCN/N=15.5644 KCN/N^2=0.000155644KCN/NlogN=0.937071
- RMN=2000851 RMN/N=20.0085 RMN/N^2=0.000200085RMN/NlogN=1.20463
- Sort randomness N=100000 TimeSpared: 160ms
- KCN=3047006 KCN/N=30.4701 KCN/N^2=0.000304701KCN/NlogN=1.83448
- RMN=3898565 RMN/N=38.9857 RMN/N^2=0.000389857RMN/NlogN=2.34717
- Sort descending N=100000 TimeSpared: 90ms
- KCN=4510383 KCN/N=45.1038 KCN/N^2=0.000451038KCN/NlogN=2.71552
- RMN=5745996 RMN/N=57.46 RMN/N^2=0.0005746 RMN/NlogN=3.45943
整體性能非常不錯(cuò),附加儲(chǔ)存1,還沒(méi)有很糟的情況,如果實(shí)在不放心快排的最壞情況,堆排確實(shí)是個(gè)好選擇。這里仍然出現(xiàn)了KCN、RMN多的反而消耗時(shí)間少的例子——誤差70ms是不可能的,看來(lái)CPU優(yōu)化的作用還是非常明顯的(可能還和Cache有關(guān))。
【編輯推薦】