JavaScript中常見(jiàn)排序算法詳解
有句話(huà)怎么說(shuō)來(lái)著:
雷鋒推倒雷峰塔,Java implements JavaScript.
當(dāng)年,想憑借抱Java大腿火一把而不惜把自己名字給改了的JavaScript(原名LiveScript),如今早已光芒萬(wàn)丈。node JS的出現(xiàn)更是讓JavaScript可以前后端通吃。雖然Java依然制霸企業(yè)級(jí)軟件開(kāi)發(fā)領(lǐng)域(C/C + +的大神們不要打我。。。),但在Web的江湖,JavaScript可謂風(fēng)頭無(wú)兩,坐上了頭把交椅。
然而,在傳統(tǒng)的計(jì)算機(jī)算法和數(shù)據(jù)結(jié)構(gòu)領(lǐng)域,大多數(shù)專(zhuān)業(yè)教材和書(shū)籍的默認(rèn)語(yǔ)言都是Java或者C/C+ +。這給最近想惡補(bǔ)算法和數(shù)據(jù)結(jié)構(gòu)知識(shí)的我造成了一定困擾,因?yàn)槲蚁雽ふ乙槐疽訨avaScript為默認(rèn)語(yǔ)言的算法書(shū)籍。當(dāng)我了解到O’REILLY家的動(dòng)物叢書(shū)系列里有一本叫做《數(shù)據(jù)結(jié)構(gòu)與算法JavaScript描述》時(shí),便興奮的花了兩天時(shí)間把這本書(shū)從頭到尾讀了一遍。它是一本很好的針對(duì)前端開(kāi)發(fā)者們的入門(mén)算法書(shū)籍,可是,它有一個(gè)很大的缺陷,就是里面有很多明顯的小錯(cuò)誤,明顯到就連我這種半路出家的程序猿都能一眼看出來(lái)。還有一個(gè)問(wèn)題是,很多重要的算法和數(shù)據(jù)結(jié)構(gòu)知識(shí)并沒(méi)有在這本書(shū)里被提到。這些問(wèn)題對(duì)于作為一個(gè)晚期強(qiáng)迫癥患者的我來(lái)說(shuō)簡(jiǎn)直不能忍。于是乎,一言不合我就決定自己找資料總結(jié)算法。那么,我就從算法領(lǐng)域里最基礎(chǔ)的知識(shí)點(diǎn)——排序算法總結(jié)起好了。
我相信以下的代碼里一定會(huì)有某些bug或錯(cuò)誤或語(yǔ)法不規(guī)范等問(wèn)題是我自己無(wú)法發(fā)現(xiàn)的,所以敬請(qǐng)各位大神能夠指出錯(cuò)誤,因?yàn)橹挥性诓粩喔腻e(cuò)的道路上我才能取得長(zhǎng)久的進(jìn)步。
十大經(jīng)典算法
一張圖概括:
名詞解釋?zhuān)?/strong>
n:數(shù)據(jù)規(guī)模
k:“桶”的個(gè)數(shù)
In-place:占用常數(shù)內(nèi)存,不占用額外內(nèi)存
Out-place:占用額外內(nèi)存
穩(wěn)定性:排序后2個(gè)相等鍵值的順序和排序之前它們的順序相同
冒泡排序
作為最簡(jiǎn)單的排序算法之一,冒泡排序給我的感覺(jué)就像Abandon在單詞書(shū)里出現(xiàn)的感覺(jué)一樣,每次都在第一頁(yè)第一位,所以最熟悉。。。冒泡排序還有一種優(yōu)化算法,就是立一個(gè)flag,當(dāng)在一趟序列遍歷中元素沒(méi)有發(fā)生交換,則證明該序列已經(jīng)有序。但這種改進(jìn)對(duì)于提升性能來(lái)說(shuō)并沒(méi)有什么太大作用。。。
什么時(shí)候最快
當(dāng)輸入的數(shù)據(jù)已經(jīng)是正序時(shí)(都已經(jīng)是正序了,我還要你冒泡排序有何用啊。。。。)
什么時(shí)候最慢
當(dāng)輸入的數(shù)據(jù)是反序時(shí)(寫(xiě)一個(gè)for循環(huán)反序輸出數(shù)據(jù)不就行了,干嘛要用你冒泡排序呢,我是閑的嗎。。。)
冒泡排序動(dòng)圖演示
JavaScript代碼實(shí)現(xiàn)
- function bubbleSort(arr) {
- var len = arr.length;
- for (var i = 0; i < len; i++) {
- for (var j = 0; j < len - 1 - i; j++) {
- if (arr[j] > arr[j+1]) { //相鄰元素兩兩對(duì)比
- var temp = arr[j+1]; //元素交換
- arr[j+1] = arr[j];
- arr[j] = temp;
- }
- }
- }
- return arr;
- }
選擇排序
表現(xiàn)最穩(wěn)定的排序算法之一,因?yàn)闊o(wú)論什么數(shù)據(jù)進(jìn)去都是O(n²)的時(shí)間復(fù)雜度。。。所以用到它的時(shí)候,數(shù)據(jù)規(guī)模越小越好。唯一的好處可能就是不占用額外的內(nèi)存空間了吧。
選擇排序動(dòng)圖演示
JavaScript代碼實(shí)現(xiàn)
- function selectionSort(arr) {
- var len = arr.length;
- var minIndex, temp;
- for (var i = 0; i < len - 1; i++) {
- minIndex = i;
- for (var j = i + 1; j < len; j++) {
- if (arr[j] < arr[minIndex]) { //尋找最小的數(shù)
- minIndex = j; //將最小數(shù)的索引保存
- }
- }
- temp = arr[i];
- arr[i] = arr[minIndex];
- arr[minIndex] = temp;
- }
- return arr;
- }
插入排序
插入排序的代碼實(shí)現(xiàn)雖然沒(méi)有冒泡排序和選擇排序那么簡(jiǎn)單粗暴,但它的原理應(yīng)該是最容易理解的了,因?yàn)橹灰蜻^(guò)撲克牌的人都應(yīng)該能夠秒懂。當(dāng)然,如果你說(shuō)你打撲克牌摸牌的時(shí)候從來(lái)不按牌的大小整理牌,那估計(jì)這輩子你對(duì)插入排序的算法都不會(huì)產(chǎn)生任何興趣了。。。
插入排序和冒泡排序一樣,也有一種優(yōu)化算法,叫做拆半插入。對(duì)于這種算法,得了懶癌的我就套用教科書(shū)上的一句經(jīng)典的話(huà)吧:感興趣的同學(xué)可以在課后自行研究。。。
插入排序動(dòng)圖演示
JavaScript代碼實(shí)現(xiàn)
- function insertionSort(arr) {
- var len = arr.length;
- var preIndex, current;
- for (var i = 1; i < len; i++) {
- preIndex = i - 1;
- current = arr[i];
- while(preIndex >= 0 && arr[preIndex] > current) {
- arr[preIndex+1] = arr[preIndex];
- preIndex--;
- }
- arr[preIndex+1] = current;
- }
- return arr;
- }
希爾排序
希爾排序是插入排序的一種更高效率的實(shí)現(xiàn)。它與插入排序的不同之處在于,它會(huì)優(yōu)先比較距離較遠(yuǎn)的元素。希爾排序的核心在于間隔序列的設(shè)定。既可以提前設(shè)定好間隔序列,也可以動(dòng)態(tài)的定義間隔序列。動(dòng)態(tài)定義間隔序列的算法是《算法(第4版》的合著者Robert Sedgewick提出的。在這里,我就使用了這種方法。
JavaScript代碼實(shí)現(xiàn)
- function shellSort(arr) {
- var len = arr.length,
- temp,
- gap = 1;
- while(gap < len/3) { //動(dòng)態(tài)定義間隔序列
- gap =gap*3+1;
- }
- for (gap; gap > 0; gap = Math.floor(gap/3)) {
- for (var i = gap; i < len; i++) {
- temp = arr[i];
- for (var j = i-gap; j >= 0 && arr[j] > temp; j-=gap) {
- arr[j+gap] = arr[j];
- }
- arr[j+gap] = temp;
- }
- }
- return arr;
- }
歸并排序
作為一種典型的分而治之思想的算法應(yīng)用,歸并排序的實(shí)現(xiàn)由兩種方法:
- 自上而下的遞歸(所有遞歸的方法都可以用迭代重寫(xiě),所以就有了第2種方法)
- 自下而上的迭代
在《數(shù)據(jù)結(jié)構(gòu)與算法JavaScript描述》中,作者給出了自下而上的迭代方法。但是對(duì)于遞歸法,作者卻認(rèn)為:
However, it is not possible to do so in JavaScript, as the recursion goes too deep for the language to handle.
然而,在 JavaScript 中這種方式不太可行,因?yàn)檫@個(gè)算法的遞歸深度對(duì)它來(lái)講太深了。
說(shuō)實(shí)話(huà),我不太理解這句話(huà)。意思是JavaScript編譯器內(nèi)存太小,遞歸太深容易造成內(nèi)存溢出嗎?還望有大神能夠指教。
和選擇排序一樣,歸并排序的性能不受輸入數(shù)據(jù)的影響,但表現(xiàn)比選擇排序好的多,因?yàn)槭冀K都是O(n log n)的時(shí)間復(fù)雜度。代價(jià)是需要額外的內(nèi)存空間。
歸并排序動(dòng)圖演示
歸并排序JavaScript代碼實(shí)現(xiàn):
- function mergeSort(arr) { //采用自上而下的遞歸方法
- var len = arr.length;
- if(len < 2) {
- return arr;
- }
- var middle = Math.floor(len / 2),
- left = arr.slice(0, middle),
- right = arr.slice(middle);
- return merge(mergeSort(left), mergeSort(right));
- }
- function merge(left, right)
- {
- var result = [];
- while (left.length && right.length) {
- if (left[0] <= right[0]) {
- result.push(left.shift());
- } else {
- result.push(right.shift());
- }
- }
- while (left.length)
- result.push(left.shift());
- while (right.length)
- result.push(right.shift());
- return result;
- }
快速排序
快速排序又是一種分而治之思想在排序算法上的典型應(yīng)用。本質(zhì)上來(lái)看,快速排序應(yīng)該算是在冒泡排序基礎(chǔ)上的遞歸分治法。
快速排序的名字起的是簡(jiǎn)單粗暴,因?yàn)橐宦?tīng)到這個(gè)名字你就知道它存在的意義,就是快,而且效率高! 它是處理大數(shù)據(jù)最快的排序算法之一了。雖然Worst Case的時(shí)間復(fù)雜度達(dá)到了O(n²),但是人家就是優(yōu)秀,在大多數(shù)情況下都比平均時(shí)間復(fù)雜度為O(n log n) 的排序算法表現(xiàn)要更好,可是這是為什么呢,我也不知道。。。好在我的強(qiáng)迫癥又犯了,查了N多資料終于在《算法藝術(shù)與信息學(xué)競(jìng)賽》上找到了滿(mǎn)意的答案:
快速排序的最壞運(yùn)行情況是O(n²),比如說(shuō)順序數(shù)列的快排。但它的平攤期望時(shí)間是O(n log n) ,且O(n log n)記號(hào)中隱含的常數(shù)因子很小,比復(fù)雜度穩(wěn)定等于O(n log n)的歸并排序要小很多。所以,對(duì)絕大多數(shù)順序性較弱的隨機(jī)數(shù)列而言,快速排序總是優(yōu)于歸并排序。
快速排序動(dòng)圖演示
快速排序JavaScript代碼實(shí)現(xiàn):
- function quickSort(arr, left, right) {
- var len = arr.length,
- partitionIndex,
- left = typeof left != 'number' ? 0 : left,
- right = typeof right != 'number' ? len - 1 : right;
- if (left < right) {
- partitionIndex = partition(arr, left, right);
- quickSort(arr, left, partitionIndex-1);
- quickSort(arr, partitionIndex+1, right);
- }
- return arr;
- }
- function partition(arr, left ,right) { //分區(qū)操作
- var pivot = left, //設(shè)定基準(zhǔn)值(pivot)
- index = pivot + 1;
- for (var i = index; i <= right; i++) {
- if (arr[i] < arr[pivot]) {
- swap(arr, i, index);
- index++;
- }
- }
- swap(arr, pivot, index - 1);
- return index-1;
- }
- function swap(arr, i, j) {
- var temp = arr[i];
- arr[i] = arr[j];
- arr[j] = temp;
- }
堆排序
堆排序可以說(shuō)是一種利用堆的概念來(lái)排序的選擇排序。分為兩種方法:
- 大頂堆:每個(gè)節(jié)點(diǎn)的值都大于或等于其子節(jié)點(diǎn)的值,在堆排序算法中用于升序排列
- 小頂堆:每個(gè)節(jié)點(diǎn)的值都小于或等于其子節(jié)點(diǎn)的值,在堆排序算法中用于降序排列
堆排序動(dòng)圖演示
堆排序JavaScript代碼實(shí)現(xiàn):
- var len; //因?yàn)槁暶鞯亩鄠€(gè)函數(shù)都需要數(shù)據(jù)長(zhǎng)度,所以把len設(shè)置成為全局變量
- function buildMaxHeap(arr) { //建立大頂堆
- len = arr.length;
- for (var i = Math.floor(len/2); i >= 0; i--) {
- heapify(arr, i);
- }
- }
- function heapify(arr, i) { //堆調(diào)整
- var left = 2 * i + 1,
- right = 2 * i + 2,
- largest = i;
- if (left < len && arr[left] > arr[largest]) {
- largest = left;
- }
- if (right < len && arr[right] > arr[largest]) {
- largest = right;
- }
- if (largest != i) {
- swap(arr, i, largest);
- heapify(arr, largest);
- }
- }
- function swap(arr, i, j) {
- var temp = arr[i];
- arr[i] = arr[j];
- arr[j] = temp;
- }
- function heapSort(arr) {
- buildMaxHeap(arr);
- for (var i = arr.length-1; i > 0; i--) {
- swap(arr, 0, i);
- len--;
- heapify(arr, 0);
- }
- return arr;
- }
計(jì)數(shù)排序
計(jì)數(shù)排序的核心在于將輸入的數(shù)據(jù)值轉(zhuǎn)化為鍵存儲(chǔ)在額外開(kāi)辟的數(shù)組空間中。作為一種線性時(shí)間復(fù)雜度的排序,計(jì)數(shù)排序要求輸入的數(shù)據(jù)必須是有確定范圍的整數(shù)。
計(jì)數(shù)排序動(dòng)圖演示
計(jì)數(shù)排序JavaScript代碼實(shí)現(xiàn):
- function countingSort(arr, maxValue) {
- var bucket = new Array(maxValue+1),
- sortedIndex = 0;
- arrLen = arr.length,
- bucketLen = maxValue + 1;
- for (var i = 0; i < arrLen; i++) {
- if (!bucket[arr[i]]) {
- bucket[arr[i]] = 0;
- }
- bucket[arr[i]]++;
- }
- for (var j = 0; j < bucketLen; j++) {
- while(bucket[j] > 0) {
- arr[sortedIndex++] = j;
- bucket[j]--;
- }
- }
- return arr;
- }
桶排序
桶排序是計(jì)數(shù)排序的升級(jí)版。它利用了函數(shù)的映射關(guān)系,高效與否的關(guān)鍵就在于這個(gè)映射函數(shù)的確定。
為了使桶排序更加高效,我們需要做到這兩點(diǎn):
- 在額外空間充足的情況下,盡量增大桶的數(shù)量
- 使用的映射函數(shù)能夠?qū)⑤斎氲腘個(gè)數(shù)據(jù)均勻的分配到K個(gè)桶中
同時(shí),對(duì)于桶中元素的排序,選擇何種比較排序算法對(duì)于性能的影響至關(guān)重要。
什么時(shí)候最快
當(dāng)輸入的數(shù)據(jù)可以均勻的分配到每一個(gè)桶中
什么時(shí)候最慢
當(dāng)輸入的數(shù)據(jù)被分配到了同一個(gè)桶中
桶排序JavaScript代碼實(shí)現(xiàn):
- function bucketSort(arr, bucketSize) {
- if (arr.length === 0) {
- return arr;
- }
- var i;
- var minValue = arr[0];
- var maxValue = arr[0];
- for (i = 1; i < arr.length; i++) {
- if (arr[i] < minValue) {
- minValue = arr[i]; //輸入數(shù)據(jù)的最小值
- } else if (arr[i] > maxValue) {
- maxValue = arr[i]; //輸入數(shù)據(jù)的最大值
- }
- }
- //桶的初始化
- var DEFAULT_BUCKET_SIZE = 5; //設(shè)置桶的默認(rèn)數(shù)量為5
- bucketSize = bucketSize || DEFAULT_BUCKET_SIZE;
- var bucketCount = Math.floor((maxValue - minValue) / bucketSize) + 1;
- var buckets = new Array(bucketCount);
- for (i = 0; i < buckets.length; i++) {
- buckets[i] = [];
- }
- //利用映射函數(shù)將數(shù)據(jù)分配到各個(gè)桶中
- for (i = 0; i < arr.length; i++) {
- buckets[Math.floor((arr[i] - minValue) / bucketSize)].push(arr[i]);
- }
- arr.length = 0;
- for (i = 0; i < buckets.length; i++) {
- insertionSort(buckets[i]); //對(duì)每個(gè)桶進(jìn)行排序,這里使用了插入排序
- for (var j = 0; j < buckets[i].length; j++) {
- arr.push(buckets[i][j]);
- }
- }
- return arr;
- }
基數(shù)排序
基數(shù)排序有兩種方法
- MSD 從高位開(kāi)始進(jìn)行排序
- LSD 從低位開(kāi)始進(jìn)行排序
基數(shù)排序 vs 計(jì)數(shù)排序 vs 桶排序
這三種排序算法都利用了桶的概念,但對(duì)桶的使用方法上有明顯差異:
- 基數(shù)排序:根據(jù)鍵值的每位數(shù)字來(lái)分配桶
- 計(jì)數(shù)排序:每個(gè)桶只存儲(chǔ)單一鍵值
- 桶排序:每個(gè)桶存儲(chǔ)一定范圍的數(shù)值
LSD基數(shù)排序動(dòng)圖演示:
基數(shù)排序JavaScript代碼實(shí)現(xiàn):
- //LSD Radix Sort
- var counter = [];
- function radixSort(arr, maxDigit) {
- var mod = 10;
- var dev = 1;
- for (var i = 0; i < maxDigit; i++, dev *= 10, mod *= 10) {
- for(var j = 0; j < arr.length; j++) {
- var bucket = parseInt((arr[j] % mod) / dev);
- if(counter[bucket]==null) {
- counter[bucket] = [];
- }
- counter[bucket].push(arr[j]);
- }
- var pos = 0;
- for(var j = 0; j < counter.length; j++) {
- var value = null;
- if(counter[j]!=null) {
- while ((value = counter[j].shift()) != null) {
- arr[pos++] = value;
- }
- }
- }
- }
- return arr;
- }
寫(xiě)在最后
排序算法實(shí)在是博大精深,還有hin多hin多我沒(méi)有總結(jié)到或者我自己還沒(méi)弄明白的算法,僅僅是總結(jié)這十種排序算法都把我寫(xiě)哭了。。。
因此,以后如果我掌握了更多的排序姿勢(shì),我一定還會(huì)回來(lái)的