自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

常用排序算法比較與分析

大數(shù)據(jù) 算法
本文主要從排序算法的基本概念、原理出發(fā),分別從算法的時間復(fù)雜度、空間復(fù)雜度、算法的穩(wěn)定性和速度等方面進(jìn)行分析比較。

 一、常用排序算法簡述

下面主要從排序算法的基本概念、原理出發(fā),分別從算法的時間復(fù)雜度、空間復(fù)雜度、算法的穩(wěn)定性和速度等方面進(jìn)行分析比較。依據(jù)待排序的問題大小(記錄數(shù)量 n)的不同,排序過程中需要的存儲器空間也不同,由此將排序算法分為兩大類:【內(nèi)排序】、【外排序】。

內(nèi)排序:指排序時數(shù)據(jù)元素全部存放在計算機(jī)的隨機(jī)存儲器RAM中。

外排序:待排序記錄的數(shù)量很大,以致內(nèi)存一次不能容納全部記錄,在排序過程中還需要對外存進(jìn)行訪問的排序過程。

先了解一下常見排序算法的分類關(guān)系(見圖1-1)

 

圖1-1 常見排序算法

二、內(nèi)排序相關(guān)算法

2.1 插入排序

核心思想:將一個待排序的數(shù)據(jù)元素插入到前面已經(jīng)排好序的數(shù)列中的適當(dāng)位置,使數(shù)據(jù)元素依然有序,直到待排序數(shù)據(jù)元素全部插入完為止。

2.1.1 直接插入排序

核心思想:將欲插入的第i個數(shù)據(jù)元素的關(guān)鍵碼與前面已經(jīng)排序好的i-1、i-2 、i-3、 … 數(shù)據(jù)元素的值進(jìn)行順序比較,通過這種線性搜索的方法找到第i個數(shù)據(jù)元素的插入位置 ,并且原來位置 的數(shù)據(jù)元素順序后移,直到全部排好順序。

直接插入排序中,關(guān)鍵詞相同的數(shù)據(jù)元素將保持原有位置不變,所以該算法是穩(wěn)定的,時間復(fù)雜度的最壞值為平方階O(n2),空間復(fù)雜度為常數(shù)階O(l)。

Python源代碼:

  1. #-------------------------直接插入排序-------------------------------- 
  2. def insert_sort(data_list): 
  3.  #遍歷數(shù)組中的所有元素,其中0號索引元素默認(rèn)已排序,因此從1開始 
  4.  for x in range(1, len(data_list)): 
  5.  #將該元素與已排序好的前序數(shù)組依次比較,如果該元素小,則交換 
  6.  #range(x-1,-1,-1):從x-1倒序循環(huán)到0 
  7.  for i in range(x-1, -1, -1): 
  8.  #判斷:如果符合條件則交換 
  9.  if data_list[i] > data_list[i+1]: 
  10.  temp = data_list[i+1] 
  11.  data_list[i+1] = data_list[i] 
  12.  data_list[i] = temp 

2.1.2 希爾排序

核心思想:是把記錄按下標(biāo)的一定增量分組,對每組使用直接插入排序算法排序;隨著增量逐漸減少,每組包含的關(guān)鍵詞越來越多,當(dāng)增量減至1時,整個文件恰被分成一組,算法便終止。

希爾排序時間復(fù)雜度會比O(n2)好一些,然而,多次插入排序中,***次插入排序是穩(wěn)定的,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,所以希爾排序是不穩(wěn)定的。

Python源代碼:

  1. #-------------------------希爾排序------------------------------- 
  2. def insert_shell(data_list): 
  3.  #初始化step值,此處利用序列長度的一半為其賦值 
  4.  group = int(len(data_list)/2) 
  5.  #***層循環(huán):依次改變group值對列表進(jìn)行分組 
  6.  while group > 0: 
  7.  #下面:利用直接插入排序的思想對分組數(shù)據(jù)進(jìn)行排序 
  8.  #range(group,len(data_list)):從group開始 
  9.  for i in range(group, len(data_list)): 
  10.  #range(x-group,-1,-group):從x-group開始與選定元素開始倒序比較,每個比較元素之間間隔group 
  11.  for j in range(i-group, -1, -group): 
  12.  #如果該組當(dāng)中兩個元素滿足交換條件,則進(jìn)行交換 
  13.  if data_list[j] > data_list[j+group]: 
  14.  temp = data_list[j+group
  15.  data_list[j+group] = data_list[j] 
  16.  data_list[j] = temp 
  17.  #while循環(huán)條件折半 
  18.  group = int(group / 2) 

2.2 選擇排序

核心思想:每一趟掃描時,從待排序的數(shù)據(jù)元素中選出關(guān)鍵碼最小或***的一個元素,順序放在已經(jīng)排好順序序列的***,直到全部待排序的數(shù)據(jù)元素排完為止。

2.2.1 直接選擇排序

核心思想:給每個位置選擇關(guān)鍵碼最小的數(shù)據(jù)元素,即:選擇最小的元素與***個位置的元素交換,然后在剩下的元素中再選擇最小的與第二個位置的元素交換,直到倒數(shù)第二個元素和***一個元素比較為止。

根據(jù)其基本思想,每當(dāng)掃描一趟時,如果當(dāng)前元素比一個元素小,而且這個小元素又出現(xiàn)在一個和當(dāng)前元素相等的元素后面,則它們的位置發(fā)生了交換,所以直接選擇排序時不穩(wěn)定的,其時間復(fù)雜度為平方階O(n2),空間復(fù)雜度為O(l)。

Python源代碼:

  1. #-------------------------直接選擇排序------------------------------- 
  2. def select_sort(data_list): 
  3. #依次遍歷序列中的每一個元素 
  4.  for i in range(0, len(data_list)): 
  5. #將當(dāng)前位置的元素定義此輪循環(huán)當(dāng)中的最小值 
  6.  minimum = data_list[i] 
  7. #將該元素與剩下的元素依次比較尋找最小元素 
  8.  for j in range(i+1, len(data_list)): 
  9.  if data_list[j] < minimum: 
  10.  temp = data_list[j]; 
  11.  data_list[j] = minimum; 
  12.  minimum = temp 
  13. #將比較后得到的真正的最小值賦值給當(dāng)前位置 
  14.  data_list[i] = minimum 

2.2.2 堆排序

堆排序時對直接選擇排序的一種有效改進(jìn)。

核心思想:將所有的數(shù)據(jù)建成一個堆,***的數(shù)據(jù)在堆頂,然后將堆頂?shù)臄?shù)據(jù)元素和序列的***一個元素交換;接著重建堆、交換數(shù)據(jù),依次下去,從而實現(xiàn)對所有的數(shù)據(jù)元素的排序。完成堆排序需要執(zhí)行兩個動作:建堆和堆的調(diào)整,如此反復(fù)進(jìn)行。

堆排序有可能會使得兩個相同值的元素位置發(fā)生互換,所以是不穩(wěn)定的,其平均時間復(fù)雜度為0(nlog2n),空間復(fù)雜度為O(l)。

Python源代碼:

  1. #-------------------------堆排序-------------------------------- 
  2. #**********獲取左右葉子節(jié)點********** 
  3. def LEFT(i): 
  4.  return 2*i + 1 
  5.   
  6. def RIGHT(i): 
  7.  return 2*i + 2 
  8.   
  9. #********** 調(diào)整大頂堆 ********** 
  10. #data_list:待調(diào)整序列 length: 序列長度 i:需要調(diào)整的結(jié)點 
  11. def adjust_max_heap(data_list,length,i): 
  12. #定義一個int值保存當(dāng)前序列***值的下標(biāo) 
  13.  largest = i 
  14. #執(zhí)行循環(huán)操作:兩個任務(wù):1 尋找***值的下標(biāo);2.***值與父節(jié)點交換 
  15.  while 1: 
  16. #獲得序列左右葉子節(jié)點的下標(biāo) 
  17.  leftright = LEFT(i), RIGHT(i) 
  18. #當(dāng)左葉子節(jié)點的下標(biāo)小于序列長度 并且 左葉子節(jié)點的值大于父節(jié)點時,將左葉子節(jié)點的下標(biāo)賦值給largest 
  19.  if (left < length) and (data_list[left] > data_list[i]): 
  20.  largest = left 
  21.  #print('左葉子節(jié)點'
  22.  else
  23.  largest = i 
  24. #當(dāng)右葉子節(jié)點的下標(biāo)小于序列長度 并且 右葉子節(jié)點的值大于父節(jié)點時,將右葉子節(jié)點的下標(biāo)值賦值給largest 
  25.  if (right < length) and (data_list[right] > data_list[largest]): 
  26.  largest = right 
  27.  #print('右葉子節(jié)點'
  28. #如果largest不等于i 說明當(dāng)前的父節(jié)點不是***值,需要交換值 
  29.  if (largest != i): 
  30.  temp = data_list[i] 
  31.  data_list[i] = data_list[largest] 
  32.  data_list[largest] = temp 
  33.  i = largest 
  34.  #print(largest) 
  35.  continue 
  36.  else
  37.  break 
  38.   
  39. #********** 建立大頂堆 ********** 
  40. def build_max_heap(data_list): 
  41.  length = len(data_list) 
  42.  for x in range(int((length-1)/2),-1,-1): 
  43.  adjust_max_heap(data_list,length,x) 
  44.   
  45. #********** 堆排序 ********** 
  46. def heap_sort(data_list): 
  47. #先建立大頂堆,保證***值位于根節(jié)點;并且父節(jié)點的值大于葉子結(jié)點 
  48.  build_max_heap(data_list) 
  49. #i:當(dāng)前堆中序列的長度.初始化為序列的長度 
  50.  i = len(data_list) 
  51. #執(zhí)行循環(huán):1. 每次取出堆頂元素置于序列的***(len-1,len-2,len-3...) 
  52. # 2. 調(diào)整堆,使其繼續(xù)滿足大頂堆的性質(zhì),注意實時修改堆中序列的長度 
  53.  while i > 0: 
  54.  temp = data_list[i-1] 
  55.  data_list[i-1] = data_list[0] 
  56.  data_list[0] = temp 
  57. #堆中序列長度減1 
  58.  i = i-1 
  59. #調(diào)整大頂堆 
  60.  adjust_max_heap(data_list, i, 0) 

2.3交換排序

核心思想:顧名思義,就是一組待排序的數(shù)據(jù)元素中,按照位置的先后順序相互比較各自的關(guān)鍵碼,如果是逆序,則交換這兩個數(shù)據(jù)元素,直到該序列數(shù)據(jù)元素有序為止。

2.3.1 冒泡排序

核心思想:對于待排序的一組數(shù)據(jù)元素,把每個數(shù)據(jù)元素看作有重量的氣泡,按照輕氣泡不能在重氣泡之下的原則,將未排好順序的全部元素自上而下的對相鄰兩個元素依次進(jìn)行比較和調(diào)整,讓較重的元素往下沉,較輕的往上冒。

根據(jù)基本思想,只有在兩個元素的順序與排序要求相反時才將調(diào)換它們的位置,否則保持不變,所以冒泡排序時穩(wěn)定的。時間復(fù)雜度為平方階O(n2),空間復(fù)雜度為O(l)。

Python源代碼:

  1. #-------------------------冒泡排序-------------------------------- 
  2. def bubble_sort(data_list): 
  3.  length = len(data_list) 
  4. #序列長度為length,需要執(zhí)行l(wèi)ength-1輪交換 
  5.  for x in range(1,length): 
  6. #對于每一輪交換,都將序列當(dāng)中的左右元素進(jìn)行比較 
  7. #每輪交換當(dāng)中,由于序列***的元素一定是***的,因此每輪循環(huán)到序列未排序的位置即可 
  8.  for i in range(0,length-x): 
  9.  if data_list[i] > data_list[i+1]: 
  10.  temp = data_list[i] 
  11.  data_list[i] = data_list[i+1] 
  12.  data_list[i+1] = temp 

2.3.2 快速排序

快速排序是對冒泡排序本質(zhì)上的改進(jìn)。

核心思想:是一個就地排序,分而治之,大規(guī)模遞歸的算法。即:通過一趟掃描后確保基準(zhǔn)點的這個數(shù)據(jù)元素的左邊元素都比它小、右邊元素都比它大,接著又以遞歸方法處理左右兩邊的元素,直到基準(zhǔn)點的左右只有一個元素為止。

快速排序時一個不穩(wěn)定的算法,其最壞值的時間復(fù)雜度為平方階O(n2),空間復(fù)雜度為O(log2n)。

Python源代碼:

  1. #-------------------------快速排序-------------------------------- 
  2. #data_list:待排序的序列;start排序的開始index,end序列末尾的index 
  3. #對于長度為length的序列:start = 0;end = length-1 
  4. def quick_sort(data_list,start,end): 
  5.  if start < end
  6.  i , j , pivot = start, end, data_list[start] 
  7.  while i < j: 
  8. #從右開始向左尋找***個小于pivot的值 
  9.  while (i < j) and (data_list[j] >= pivot): 
  10.  j = j-1 
  11. #將小于pivot的值移到左邊 
  12.  if (i < j): 
  13.  data_list[i] = data_list[j] 
  14.  i = i+1 
  15. #從左開始向右尋找***個大于pivot的值 
  16.  while (i < j) and (data_list[i] < pivot): 
  17.  i = i+1 
  18. #將大于pivot的值移到右邊 
  19.  if (i < j): 
  20.  data_list[j] = data_list[i] 
  21.  j = j-1 
  22. #循環(huán)結(jié)束后,說明 i=j,此時左邊的值全都小于pivot,右邊的值全都大于pivot 
  23. #pivot的位置移動正確,那么此時只需對左右兩側(cè)的序列調(diào)用此函數(shù)進(jìn)一步排序即可 
  24. #遞歸調(diào)用函數(shù):依次對左側(cè)序列:從0 ~ i-1//右側(cè)序列:從i+1 ~ end 
  25.  data_list[i] = pivot 
  26. #左側(cè)序列繼續(xù)排序 
  27.  quick_sort(data_list,start,i-1) 
  28. #右側(cè)序列繼續(xù)排序 
  29.  quick_sort(data_list,i+1,end

2.4歸并排序

核心思想:把數(shù)據(jù)序列遞歸地分成短序列,即把1分成2、2分成4、依次分解,當(dāng)分解到只有1個一組的時候排序這些分組,然后依次合并回原來的序列,不斷合并直到原序列全部排好順序。

合并過程中可以確保兩個相等的當(dāng)前元素中,把處在前面的元素保存在結(jié)果序列的前面,因此歸并排序是穩(wěn)定的,其時間復(fù)雜度為O(nlog2n),空間復(fù)雜度為O(n)。

Python源代碼:

  1. #-------------------------歸并排序-------------------------------- 
  2. #這是合并的函數(shù) 
  3. # 將序列data_list[first...mid]與序列data_list[mid+1...last]進(jìn)行合并 
  4. def mergearray(data_list,first,mid,last,temp): 
  5. #對i,j,k分別進(jìn)行賦值 
  6.  i,j,k = first,mid+1,0 
  7. #當(dāng)左右兩邊都有數(shù)時進(jìn)行比較,取較小的數(shù) 
  8.  while (i <= mid) and (j <= last): 
  9.  if data_list[i] <= data_list[j]: 
  10.  temp[k] = data_list[i] 
  11.  i = i+1 
  12.  k = k+1 
  13.  else
  14.  temp[k] = data_list[j] 
  15.  j = j+1 
  16.  k = k+1 
  17. #如果左邊序列還有數(shù) 
  18.  while (i <= mid): 
  19.  temp[k] = data_list[i] 
  20.  i = i+1 
  21.  k = k+1 
  22. #如果右邊序列還有數(shù) 
  23.  while (j <= last): 
  24.  temp[k] = data_list[j] 
  25.  j = j+1 
  26.  k = k+1 
  27. #將temp當(dāng)中該段有序元素賦值給data_list待排序列使之部分有序 
  28.  for x in range(0,k): 
  29.  data_list[first+x] = temp[x] 
  30. # 這是分組的函數(shù) 
  31. def merge_sort(data_list,first,last,temp): 
  32.  if first < last
  33.  mid = (int)((first + last) / 2) 
  34. #使左邊序列有序 
  35.  merge_sort(data_list,first,mid,temp
  36. #使右邊序列有序 
  37.  merge_sort(data_list,mid+1,last,temp
  38. #將兩個有序序列合并 
  39.  mergearray(data_list,first,mid,last,temp
  40. # 歸并排序的函數(shù) 
  41. def merge_sort_array(data_list): 
  42. #聲明一個長度為len(data_list)的空列表 
  43.  temp = len(data_list)*[None] 
  44. #調(diào)用歸并排序 
  45.  merge_sort(data_list,0,len(data_list)-1,temp

2.5 基數(shù)排序

核心思想:首先是低位排序,然后收集;其次是高位排序,然后再收集;依次類推,直到***位。

Python源代碼:

  1. #-------------------------基數(shù)排序-------------------------------- 
  2. #確定排序的次數(shù) 
  3. #排序的順序跟序列中***數(shù)的位數(shù)相關(guān) 
  4. def radix_sort_nums(data_list): 
  5.  maxNum = data_list[0] 
  6. #尋找序列中的***數(shù) 
  7.  for x in data_list: 
  8.  if maxNum < x: 
  9.  maxNum = x 
  10. #確定序列中的***元素的位數(shù) 
  11.  times = 0 
  12.  while (maxNum > 0): 
  13.  maxNum = (int)(maxNum/10) 
  14.  times = times+1 
  15.  return times 
  16. #找到num從低到高第pos位的數(shù)據(jù) 
  17. def get_num_pos(num,pos): 
  18.  return ((int)(num/(10**(pos-1))))%10 
  19. #基數(shù)排序 
  20. def radix_sort(data_list): 
  21.  count = 10*[None] #存放各個桶的數(shù)據(jù)統(tǒng)計個數(shù) 
  22.  bucket = len(data_list)*[None] #暫時存放排序結(jié)果 
  23. #從低位到高位依次執(zhí)行循環(huán) 
  24.  for pos in range(1,radix_sort_nums(data_list)+1): 
  25.  #置空各個桶的數(shù)據(jù)統(tǒng)計 
  26.  for x in range(0,10): 
  27.  count[x] = 0 
  28.  #統(tǒng)計當(dāng)前該位(個位,十位,百位....)的元素數(shù)目 
  29.  for x in range(0,len(data_list)): 
  30.  #統(tǒng)計各個桶將要裝進(jìn)去的元素個數(shù) 
  31.  j = get_num_pos(int(data_list[x]),pos) 
  32.  count[j] = count[j]+1 
  33.  #count[i]表示第i個桶的右邊界索引 
  34.  for x in range(1,10): 
  35.  count[x] = count[x] + count[x-1] 
  36.  #將數(shù)據(jù)依次裝入桶中 
  37.  for x in range(len(data_list)-1,-1,-1): 
  38.  #求出元素第K位的數(shù)字 
  39.  j = get_num_pos(data_list[x],pos) 
  40.  #放入對應(yīng)的桶中,count[j]-1是第j個桶的右邊界索引 
  41.  bucket[count[j]-1] = data_list[x] 
  42.  #對應(yīng)桶的裝入數(shù)據(jù)索引-1 
  43.  count[j] = count[j]-1 
  44.  # 將已分配好的桶中數(shù)據(jù)再倒出來,此時已是對應(yīng)當(dāng)前位數(shù)有序的表 
  45.  for x in range(0,len(data_list)): 
  46.  data_list[x] = bucket[x] 

三、排序算法實測

圖3-1 常用排序算法測試統(tǒng)計

 

圖3-1 常用排序算法測試統(tǒng)計

四、排序算法對比與分析

表4-1各個排序算法比較

 

表4-1各個排序算法比較

[直接插入排序]是對冒泡排序的改進(jìn),比冒泡排序快,但是只適用于數(shù)據(jù)量較小(1000 ) 的排序

[希爾排序]比較簡單,適用于小數(shù)據(jù)量(5000以下)的排序,比直接插入排序快、冒泡排序快,因此,希爾排序適用于小數(shù)據(jù)量的、排序速度要求不高的排序。

[直接選擇排序]和冒泡排序算法一樣,適用于n值較小的場合,而且是排序算法發(fā)展的初級階段,在實際應(yīng)用中采用的幾率較小。

[堆排序]比較適用于數(shù)據(jù)量達(dá)到百萬及其以上的排序,在這種情況下,使用遞歸設(shè)計的快速排序和歸并排序可能會發(fā)生堆棧溢出的現(xiàn)象。

[冒泡排序]是最慢的排序算法,是排序算法發(fā)展的初級階段,實際應(yīng)用中采用該算法的幾率比較小。

[快速排序]是遞歸的、速度最快的排序算法,但是在內(nèi)存有限的情況下不是一個好的選擇;而且,對于基本有序的數(shù)據(jù)序列排序,快速排序反而變得比較慢。

[歸并排序]比堆排序要快,但是需要的存儲空間增加一倍。

[基數(shù)排序]適用于規(guī)模n值很大的場合,但是只適用于整數(shù)的排序,如果對浮點數(shù)進(jìn)行基數(shù)排序,則必須明確浮點數(shù)的存儲格式,然后通過某種方式將其映射到整數(shù)上,***再映射回去,過程復(fù)雜。

責(zé)任編輯:武曉燕 來源: 36大數(shù)據(jù)
相關(guān)推薦

2023-03-13 10:08:31

數(shù)據(jù)結(jié)構(gòu)算法

2023-04-27 09:13:20

排序算法數(shù)據(jù)結(jié)構(gòu)

2019-09-17 16:30:18

java排序算法

2012-01-09 14:29:15

Java算法

2009-09-03 11:47:43

Groovy與Java

2013-06-08 11:25:18

路由協(xié)議路由技術(shù)路由器

2009-08-26 18:14:11

C#排序算法

2014-10-30 15:08:21

快速排序編程算法

2011-08-19 09:48:01

C#數(shù)組

2012-07-02 14:47:38

HTML5

2016-12-07 10:42:57

排序算法實例

2015-11-12 11:05:07

java排序算法

2012-06-27 15:33:30

Java排序算法

2023-03-06 08:10:52

數(shù)據(jù)結(jié)構(gòu)算法數(shù)據(jù)

2023-03-02 08:15:13

2023-03-10 08:07:39

數(shù)據(jù)結(jié)構(gòu)算法計數(shù)排序

2023-03-07 08:02:07

數(shù)據(jù)結(jié)構(gòu)算法數(shù)列

2010-04-30 11:41:39

Oracle常用函數(shù)

2020-10-20 14:10:51

Python代碼字符串

2021-04-15 09:36:44

Java數(shù)據(jù)結(jié)構(gòu)算法
點贊
收藏

51CTO技術(shù)棧公眾號