經(jīng)典四講貫通C++排序之三 交換排序
我們都知道C++排序方法中,有四種常用方法插入排序、希爾排序、交換排序以及選擇排序。在前面兩篇文章中,我們介紹了C++兩種排序方法——插入排序和希爾排序,這篇文章我們介紹C++排序的第三種方法——交換排序。(本系列文章統(tǒng)一 測(cè)試程序)
交換排序
基本思想是:兩兩比較待排序記錄的關(guān)鍵碼,如果發(fā)生逆序,則交換之,直到所有對(duì)象都排好為止。
起泡排序
起泡排序是比較相鄰的兩個(gè)記錄,逆序則交換。這樣的做法導(dǎo)致小的關(guān)鍵碼一層層的浮上來(lái),因此得名。51cto的論壇曾經(jīng)討論過(guò)“冒泡”和“起泡”是不是一個(gè)東西,看來(lái)這是翻譯惹的禍,英文名都是Bubble Sort,具體寫(xiě)的時(shí)候可以正著排,也可以倒著排。(嚴(yán)版是從后往前排,殷版是從前往后排,好在兩本書(shū)都翻譯為“起泡排序”,不然就正像某些人得出的結(jié)論——一個(gè)是從后往前排,一個(gè)是從前往后排)
- template <class T>
- void BubbleSort(T a[], int N, int& KCN, int& RMN)
- {
- KCN = 0; RMN = 0; bool exchange = true;
- for (int i = 1; i < N && exchange; i++)
- for (int j = N - 1; j >= i; j--)
- {
- exchange = false;
- if (++KCN && a[j - 1] > a[j]) { swap(a[j - 1], a[j]); exchange = true; RMN += 3; }
- }
- }
需要注意的是,不要寫(xiě)成下面這個(gè)樣子,雖然結(jié)果是對(duì)的:
- template <class T>
- void BubbleSort2(T a[], int N)
- {
- for (int i = 0; i < N; i++)
- for (int j = 1; j < N - i; j++)
- if (a[j - 1] > a[j]) swap(a[j - 1], a[j]);
- }
測(cè)試結(jié)果:
- Sort ascending N=10000 TimeSpared: 0ms
- KCN=9999 KCN/N=0.9999 KCN/N^2=9.999e-005 KCN/NlogN=0.07525
- RMN=0 RMN/N=0 RMN/N^2=0 RMN/NlogN=0
- Sort randomness N=10000 TimeSpared: 1161ms
- KCN=45409094 KCN/N=4540.91 KCN/N^2=0.454091 KCN/NlogN=341.737
- RMN=71526984 RMN/N=7152.7 RMN/N^2=0.71527 RMN/NlogN=538.294
- Sort descending N=10000 TimeSpared: 1022ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=149985000 RMN/N=14998.5 RMN/N^2=1.49985 RMN/NlogN=1128.75
可以看出,效率非常的差,還不如直插排序,真不知道為什么人們對(duì)此津津樂(lè)道,難道是為了理解快速排序?另外還有一個(gè)有趣的現(xiàn)象,雖然逆序的KCN和RMN都比亂序的多,但是逆序花的時(shí)間卻比亂序少,從這里可以看到CPU流水線的作用,這里可以給我們一個(gè)信號(hào),一個(gè)真正好的算法需要充分利用硬件的特性。增多記錄數(shù)目(N=1000000)時(shí),可以看出,在完全有序的情況下,起泡比直插要好一些,因?yàn)榇藭r(shí)不需要移動(dòng)記錄。
#p#
快速排序
真為這個(gè)算法感到悲哀,連一個(gè)能表明算法實(shí)質(zhì)的名字(比如直插、表插)都沒(méi)有,也不像希爾排序是以發(fā)明人的名字命名的,難道就是因?yàn)樗炝?也許“快速”是對(duì)一個(gè)排序算法最高的榮譽(yù)吧。
基本思想是:任取待排序列的某個(gè)記錄作為基準(zhǔn),按照該關(guān)鍵碼大小,將整個(gè)序列分成兩個(gè)序列——左側(cè)的所有記錄的關(guān)鍵碼都比基準(zhǔn)小(或者等),右側(cè)的都比基準(zhǔn)大,基準(zhǔn)則放在兩個(gè)子序列之間,顯然這時(shí)基準(zhǔn)放在了最后應(yīng)該放置的位置。分別對(duì)左右子序列重復(fù)上面的過(guò)程,直到最后所有的記錄都放在相應(yīng)的位置。
下面的例程不容易看懂,因?yàn)檫@是幾次改進(jìn)之后的樣子:
- template <class T>
- int Partition(T a[], int left, int right, int& KCN, int& RMN)
- {
- int pivotpos = left; T pivot = a[left];//樞軸
- for (int i = left + 1; i <= right; i++)
- if (++KCN && a[i] < pivot && ++pivotpos != i)
- { swap(a[i], a[pivotpos]); RMN += 3;}
- swap(a[left], a[pivotpos]); RMN += 3;
- return pivotpos;
- }
將計(jì)算樞軸位置單獨(dú)作為一個(gè)函數(shù),可以避免遞歸的時(shí)候保存無(wú)用的臨時(shí)變量。當(dāng)你決定使用遞歸的時(shí)候,都要注意這點(diǎn)——將一切可以放在遞歸外面的都放在外面。注意這個(gè)函數(shù)是怎樣達(dá)到我們“樞軸左邊都比它小,右邊都比它大”的目的。
- template <class T>
- void QSRecurve(T a[], int left, int right, int& KCN, int& RMN)
- {
- if (left < right)
- {
- int pivotpos = Partition
(a, left, right, KCN, RMN); - QSRecurve
(a, left, pivotpos - 1, KCN, RMN); - QSRecurve
(a, pivotpos + 1, right, KCN, RMN); - }
- }
- template <class T>
- void QuickSort(T a[], int N, int& KCN, int& RMN)
- {
- KCN = 0; RMN = 0;
- QSRecurve
(a, 0, N - 1, KCN, RMN); - }
這兩個(gè)只能算個(gè)外殼了,尤其是最后一個(gè)。
測(cè)試結(jié)果:
- Sort ascending N=10000 TimeSpared: 1051ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=29997 RMN/N=2.9997 RMN/N^2=0.00029997 RMN/NlogN=0.22575
- Sort randomness N=10000 TimeSpared: 0ms
- KCN=155655 KCN/N=15.5655 KCN/N^2=0.00155655 KCN/NlogN=1.17142
- RMN=211851 RMN/N=21.1851 RMN/N^2=0.00211851 RMN/NlogN=1.59434
- Sort descending N=10000 TimeSpared: 1082ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=29997 RMN/N=2.9997 RMN/N^2=0.00029997 RMN/NlogN=0.22575
可以看到,平均性能非常好,但是在兩端的性能還不如直插。測(cè)試N=100000的情況如下(千萬(wàn)記住把正序和逆序的測(cè)試注釋掉,否則,到時(shí)候“死機(jī)”不要找我)
- Sort randomness N=100000 TimeSpared: 110ms
- KCN=2123221 KCN/N=21.2322 KCN/N^2=0.000212322KCN/NlogN=1.27831
- RMN=3010848 RMN/N=30.1085 RMN/N^2=0.000301085RMN/NlogN=1.81271
確實(shí)非常的“快速”,但是它的最壞情況實(shí)在讓人不能放心,萬(wàn)一……,并且由于使用堆棧遞歸,出了最壞情況沒(méi)準(zhǔn)程序就崩潰了。為了減低這種不良傾向,改進(jìn)辦法是“三者取中”,即選取待排序序列的第一個(gè)、最后一個(gè)、中間一個(gè)的關(guān)鍵碼居中的那個(gè)作為基準(zhǔn)。只要改一下Partition函數(shù)就可以了。
- template <class T>
- int Partition(T a[], int left, int right, int& KCN, int& RMN)
- {
- int mid = (left + right) / 2;
- if (++KCN && a[left] > a[mid])
- {
- if (++KCN && a[left] > a[right])
- {
- if (++KCN && a[mid] > a[right]) { swap(a[mid], a[left]); RMN += 3; }
- else { swap(a[right], a[left]); RMN += 3; }
- }
- }
- else
- {
- if (++KCN && a[left] < a[right])
- {
- if (++KCN && a[mid] < a[right]) { swap(a[mid], a[left]); RMN += 3; }
- else { swap(a[right], a[left]); RMN += 3; }
- }
- }
- int pivotpos = left; T pivot = a[left];//樞軸
- for (int i = left + 1; i <= right; i++)
- if (++KCN && a[i] < pivot && ++pivotpos != i) { swap(a[i], a[pivotpos]); RMN += 3;}
- swap(a[left], a[pivotpos]); RMN += 3;
- return pivotpos;
- }
只是在原有的Partition函數(shù)上添加了粗體部分。下面是測(cè)試結(jié)果:
- Sort ascending N=10000 TimeSpared: 0ms
- KCN=131343 KCN/N=13.1343 KCN/N^2=0.00131343 KCN/NlogN=0.988455
- RMN=35424 RMN/N=3.5424 RMN/N^2=0.00035424 RMN/NlogN=0.266592
- Sort randomness N=10000 TimeSpared: 0ms
- KCN=154680 KCN/N=15.468 KCN/N^2=0.0015468 KCN/NlogN=1.16408
- RMN=204093 RMN/N=20.4093 RMN/N^2=0.00204093 RMN/NlogN=1.53595
- Sort descending N=10000 TimeSpared: 280ms
- KCN=12517506 KCN/N=1251.75 KCN/N^2=0.125175 KCN/NlogN=94.2036
- RMN=45006 RMN/N=4.5006 RMN/N^2=0.00045006 RMN/NlogN=0.338704
下面是N=100000的測(cè)試結(jié)果,在逆序的時(shí)候還是很尷尬,不過(guò)還算說(shuō)得過(guò)去。
- Sort ascending N=100000 TimeSpared: 60ms
- KCN=1665551 KCN/N=16.6555 KCN/N^2=0.000166555KCN/NlogN=1.00276
- RMN=393210 RMN/N=3.9321 RMN/N^2=3.9321e-005RMN/NlogN=0.236736
- Sort randomness N=100000 TimeSpared: 110ms
- KCN=1888590 KCN/N=18.8859 KCN/N^2=0.000188859KCN/NlogN=1.13704
- RMN=2659857 RMN/N=26.5986 RMN/N^2=0.000265986RMN/NlogN=1.60139
- Sort descending N=100000 TimeSpared: 42120ms
- KCN=1250175006 KCN/N=12501.8 KCN/N^2=0.125018 KCN/NlogN=752.68
- RMN=450006 RMN/N=4.50006 RMN/N^2=4.50006e-005RMN/NlogN=0.270931
然而實(shí)際上,我們花那么多語(yǔ)句搞一個(gè)“三者取中”還不如直接“隨便選一個(gè)”來(lái)得高效,例如將下面的語(yǔ)句替換掉原來(lái)的粗體語(yǔ)句:
- swap(a[left], a[rnd(right-left)+left]); RMN += 3;
測(cè)試結(jié)果:
- Sort ascending N=100000 TimeSpared: 90ms
- KCN=1917756 KCN/N=19.1776 KCN/N^2=0.000191776KCN/NlogN=1.1546
- RMN=378810 RMN/N=3.7881 RMN/N^2=3.7881e-005RMN/NlogN=0.228066
- Sort randomness N=100000 TimeSpared: 120ms
- KCN=1979189 KCN/N=19.7919 KCN/N^2=0.000197919KCN/NlogN=1.19159
- RMN=3175977 RMN/N=31.7598 RMN/N^2=0.000317598RMN/NlogN=1.91213
- Sort descending N=100000 TimeSpared: 110ms
- KCN=2069369 KCN/N=20.6937 KCN/N^2=0.000206937KCN/NlogN=1.24588
- RMN=2574174 RMN/N=25.7417 RMN/N^2=0.000257417RMN/NlogN=1.54981
可以看到逆序的效率有了質(zhì)的飛躍,隨機(jī)函數(shù)得自己寫(xiě),因?yàn)閹?kù)函數(shù)的rand()最大只能輸出0x7fff,這是因?yàn)閞and函數(shù)使用的是32bit的整數(shù),為了不溢出(最嚴(yán)重的是出負(fù)數(shù)),只能輸出那么大。一個(gè)不太嚴(yán)格的隨機(jī)函數(shù)如下,最大輸出值是32bit的最大正整數(shù):
- int rnd(int n)
- {
- static _int64 x;
- x = (2053 * x + 13849) % 0x7fffffff;
- return (int)x % n;
- }
【編輯推薦】