經(jīng)典四講貫通C++排序之一 插入排序
我們都知道C++排序方法中,有四種常用方法插入排序、希爾排序、交換排序以及選擇排序。這篇文章我們介紹插入排序。在介紹插入之前,先引入我們整個系列文章中的測試程序。
測試程序
后面的例程,都是對數(shù)組的排序,使用靜態(tài)鏈表的也適用于鏈表的排序。為簡單起見,只對單關(guān)鍵碼排序,并且***的結(jié)果都是從頭到尾按升序排列。下面是統(tǒng)一的測試程序:
- #include
- #include
- using namespace std;
- #include
- #include
- #include
- #include "InsertSort.h"
- #define random(num) (rand() % (num))
- #define randomize() srand((unsigned)time(NULL))
- #define N 10000 //排序元素的數(shù)目
- #define SORT InsertSort //排序方法
- class timer//單位ms
- {
- public:
- void start() { start_t = clock(); }
- clock_t time() { return (clock() - start_t); }
- private:
- clock_t start_t;
- };
- int KCN, RMN; timer TIMER;
- void test(int a[])
- {
- TIMER.start();
- SORT<int>(a, N, KCN, RMN);
- cout << "\tTimeSpared: " << TIMER.time() << "ms" << endl;
- cout << "KCN=" << left << setw(11) << KCN;
- cout << "KCN/N=" << left << setw(11)<< (double)KCN/N;
- cout << "KCN/N^2=" << left << setw(11)<< (double)KCN/N/N;
- cout << "KCN/NlogN=" << left << setw(11)<< (double)KCN/N/log((double)N)*log(2.0) << endl;
- cout << "RMN=" << left << setw(11) << RMN;
- cout << "RMN/N=" << left << setw(11)<< (double)RMN/N;
- cout << "RMN/N^2=" << left << setw(11)<< (double)RMN/N/N;
- cout << "RMN/NlogN=" << left << setw(11)<< (double)RMN/N/log((double)N)*log(2.0) << endl;
- }
- int main()
- {
- int i;
- //randomize();為了在相同情況下比較各個排序算法,不加這句
- int* ascending = new int[N];//升序序列
- int* descending = new int[N];//降序序列
- int* randomness = new int[N];//隨機(jī)序列
- for (i = 0; i < N; i++) { ascending[i] = i; randomness[i] = i; descending[i] = N - i - 1;}
- for (i = 0; i < N; i++) swap(randomness[i], randomness[random(N)]);
- cout << "Sort ascending N=" << N; test(ascending);
- cout << "Sort randomness N=" << N; test(randomness);
- cout << "Sort descending N=" << N; test(descending);
- return 0;
- }
需要說明一點,KCN(關(guān)鍵碼比較次數(shù))、RMN(記錄移動次數(shù))并不是算法必須的,是為了對算法的性能有個直觀的評價(不用那些公式算來算去)。對10000個整數(shù)排序應(yīng)該是最省事的測試手段,建議不要再增多記錄數(shù)目了,一是在最壞的情況不用等太久的時間,二是避免KCN、RMN溢出,另外有些遞歸的算法在情況比較糟的時候,記錄數(shù)目太多堆??赡軙绯觯瑢?dǎo)致程序崩潰。
#p#
插入排序
基本思想是,每步將一個待排序的記錄,按其關(guān)鍵碼大小,插入到前面已經(jīng)排好序的記錄的適當(dāng)位置,從頭做到尾就可以了。
直接插入排序
- template <class T>
- void InsertSort(T a[], int N, int& KCN, int& RMN)
- {
- KCN = 0; RMN = 0;
- for (int i = 1; i < N; i++)
- {
- T temp = a[i]; RMN++;
- for (int j = i; j > 0 && ++KCN && temp < a[j - 1]; j--) { a[j] = a[j - 1]; RMN++; }
- a[j] = temp; RMN++;
- }
- }
精簡之后就是這樣:
- template<class T> void InsertSort(T a[], int N)
- {
- for (int i = 1; i < N; i++)
- {
- T temp = a[i];
- for (int j = i; j > 0 && temp < a[j - 1]; j--) a[j] = a[j - 1];
- a[j] = temp;
- }
- }
測試結(jié)果:
- Sort ascending N=10000 TimeSpared: 0ms
- KCN=9999 KCN/N=0.9999 KCN/N^2=9.999e-005 KCN/NlogN=0.07525
- RMN=19998 RMN/N=1.9998 RMN/N^2=0.00019998 RMN/NlogN=0.1505
- Sort randomness N=10000 TimeSpared: 330ms
- KCN=24293730 KCN/N=2429.37 KCN/N^2=0.242937 KCN/NlogN=182.829
- RMN=24303739 RMN/N=2430.37 RMN/N^2=0.243037 RMN/NlogN=182.904
- Sort descending N=10000 TimeSpared: 711ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=50014998 RMN/N=5001.5 RMN/N^2=0.50015 RMN/NlogN=376.4
可以看出,平均性能近似為n2/4。
折半插入排序
將直插排序中的搜索策略由順序搜索變?yōu)檎郯胨阉鳎隳艿玫酱朔N排序方法。顯而易見,只能減少KCN,不能減少RMN,所能帶來的性能提升也不會太大。
- template<class T>
- void BinaryInsertSort(T a[], int N, int& KCN, int& RMN)
- {
- KCN = 0; RMN = 0;
- for (int i = 1; i < N; i++)
- {
- T temp = a[i]; RMN++; int low = 0, high = i - 1;
- while (low <= high)//折半查找
- {
- int mid = (low + high) / 2;
- if (++KCN && temp < a[mid]) high = mid - 1; else low = mid + 1;
- }
- for (int j = i - 1; j >= low; j--) { a[j + 1] = a[j]; RMN++; }//記錄后移
- a[low] = temp; RMN++;//插入
- }
- }
測試結(jié)果:
- Sort ascending N=10000 TimeSpared: 0ms
- KCN=123617 KCN/N=12.3617 KCN/N^2=0.00123617 KCN/NlogN=0.930311
- RMN=19998 RMN/N=1.9998 RMN/N^2=0.00019998 RMN/NlogN=0.1505
- Sort randomness N=10000 TimeSpared: 320ms
- KCN=118987 KCN/N=11.8987 KCN/N^2=0.00118987 KCN/NlogN=0.895466
- RMN=24303739 RMN/N=2430.37 RMN/N^2=0.243037 RMN/NlogN=182.904
- Sort descending N=10000 TimeSpared: 631ms
- KCN=113631 KCN/N=11.3631 KCN/N^2=0.00113631 KCN/NlogN=0.855158
- RMN=50014998 RMN/N=5001.5 RMN/N^2=0.50015 RMN/NlogN=376.4
可以看到KCN近似為nlog2n,有一定的性能提升。
表插入排序
如果用“指針”來表示記錄間的順序,就可以避免大量的記錄移動,當(dāng)然,***還是要根據(jù)“指針”重排一下。自然的,折半查找在這里用不上了。
- template <class T>
- void TableInsertSort(T a[], int N, int& KCN, int& RMN)
- {
- KCN = 0; RMN = 0;
- int* link = new int[N]; int head = 0, pre, cur, i; link[0] = -1;
- for (i = 1; i < N; i++)
- {
- if (a[head] > a[i]) { link[i] = head; head = i; KCN++;}//沒設(shè)表頭,因此需要此判斷,失敗時此次判斷沒記入KCN
- else
- {
- for (cur = head; cur != -1&& ++KCN && a[cur] <= a[i]; cur = link[cur]) pre = cur;
- link[pre] = i; link[i] = cur;
- }
- }
- cur = head;//重排序列
- for (i = 0; i < N; i++)
- {
- while (cur < i) cur = link[cur];
- pre = link[cur];
- if (cur != i)
- {
- swap(a[i], a[cur]); RMN += 3;
- link[cur] = link[i]; link[i] = cur;
- }
- cur = pre;
- }
- delete []link;
- }
測試結(jié)果:
- Sort ascending N=10000 TimeSpared: 751ms
- KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25
- RMN=0 RMN/N=0 RMN/N^2=0 RMN/NlogN=0
- Sort randomness N=10000 TimeSpared: 621ms
- KCN=25721250 KCN/N=2572.13 KCN/N^2=0.257213 KCN/NlogN=193.572
- RMN=29955 RMN/N=2.9955 RMN/N^2=0.00029955 RMN/NlogN=0.225434
- Sort descending N=10000 TimeSpared: 0ms
- KCN=9999 KCN/N=0.9999 KCN/N^2=9.999e-005 KCN/NlogN=0.07525
- RMN=15000 RMN/N=1.5 RMN/N^2=0.00015 RMN/NlogN=0.112886
可以看到,確實減少了RMN,理論上RMNmax=3(n-1)。然而,就平均情況而言,性能還不如簡單的直插——這是由于測試對象是整數(shù)的緣故。對于鏈表來說,這種方法就不需要***的重排了。關(guān)于重排的算法在嚴(yán)蔚敏的《數(shù)據(jù)結(jié)構(gòu)(C語言版)》上有詳細(xì)的說明。
【編輯推薦】