排序大的分類可以分為兩種:內(nèi)排序和外排序。在排序過程中,全部記錄存放在內(nèi)存,則稱為內(nèi)排序,如果排序過程中需要使用外存,則稱為外排序。下面講的排序都是屬于內(nèi)排序。
內(nèi)排序有可以分為以下幾類:(1)、插入排序:直接插入排序、二分法插入排序、希爾排序。(2)、選擇排序:簡單選擇排序、堆排序。(3)、交換排序:冒泡排序、快速排序。(4)、歸并排序(5)、基數(shù)排序
插入排序
思想
每步將一個(gè)待排序的記錄,按其順序碼大小插入到前面已經(jīng)排序的字序列的合適位置,直到全部插入排序完為止。
1.1 直接插入排序
基本思想
每步將一個(gè)待排序的記錄,按其順序碼大小插入到前面已經(jīng)排序的字序列的合適位置(從后向前找到合適位置后),直到全部插入排序完為止。
圖示
Java代碼實(shí)現(xiàn)
packagesort;publicclassStraightInsertionSort{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);for(inti=0;i=0;j--){if(arr[j]>temp)arr[j+1]=arr[j];elsebreak;}arr[j+1]=temp;}System.out.println("");System.out.println("排序之后:");printArray(arr);}privatestaticvoidprintArray(int[]arr){for(intx:arr){System.out.print(x+"");}}}
Python代碼實(shí)現(xiàn)
definsertion_sort(a_list):forindexinrange(1,len(a_list)):current_value=a_list[index]#這里不能減1position=index#這里比較的是前一個(gè)位置的值whileposition>0anda_list[position-1]>current_value:a_list[position]=a_list[position-1]position-=1a_list[position]=current_valuea_list=[54,26,93,15,77,31,44,55,20]print(a_list)insertion_sort(a_list)print(a_list)
算法分析
直接插入排序是穩(wěn)定的排序。直接插入排序的平均時(shí)間復(fù)雜度為O(n^2)。
文件初態(tài)不同時(shí),直接插入排序所耗費(fèi)的時(shí)間有很大差異。若文件初態(tài)為正序,則每個(gè)待插入的記錄只需要比較一次就能夠找到合適的位置插入,故算法的時(shí)間復(fù)雜度為O(n),這時(shí)最好的情況。若初態(tài)為反序,則第i個(gè)待插入記錄需要比較i+1次才能找到合適位置插入,故時(shí)間復(fù)雜度為O(n^2),這時(shí)最壞的情況。
1.2 二分法插入排序
基本思想二分法插入排序的思想和直接插入一樣,只是找合適的插入位置的方式不同,這里是按二分法找到合適的位置,可以減少比較的次數(shù)。
圖示
Java代碼實(shí)現(xiàn)
packagesort;publicclassinsertionSortBinarysearch{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);sort(arr);System.out.println("");System.out.println("排序之后:");printArray(arr);}privatestaticvoidsort(int[]arr){for(inti=1;itemp)right=mid-1;elseleft=mid+1;}for(intj=i-1;j>=left;j--){arr[j+1]=arr[j];}arr[left]=temp;}}privatestaticvoidprintArray(int[]arr){for(intx:arr){System.out.print(x+"");}}}
Python代碼實(shí)現(xiàn)
definsertion_sort_binarysearch(a_list):forindexinrange(1,len(a_list)):low=0high=index-1current_value=a_list[index]position=indexwhilelow<=high:???middle?=?(low+high)//2???if?a_list[middle]?>current_value:high=middle-1else:low=middle+1whileposition>low:a_list[position]=a_list[position-1]position-=1a_list[low]=current_valuea_list=[54,26,93,15,77,31,44,55,20]insertion_sort_binarysearch(a_list)print(a_list)
算法分析
二分法插入排序也是穩(wěn)定的。
二分插入排序的比較次數(shù)與待排序記錄的初始狀態(tài)無關(guān),僅依賴于記錄的個(gè)數(shù)。當(dāng)n較大時(shí),比直接插入排序的最大比較次數(shù)少得多。但大于直接插入排序的最小比較次數(shù)。算法的移動(dòng)次數(shù)與直接插入排序算法的相同,最壞的情況為n2/2,最好的情況為n,平均移動(dòng)次數(shù)為O(n2)。
1.3 希爾排序
基本思想
先取一個(gè)小于n的整數(shù)d1作為第一個(gè)增量,把文件的全部記錄分成d1個(gè)組。所有距離為d1的倍數(shù)的記錄放在同一個(gè)組中。先在各組內(nèi)進(jìn)行直接插入排序;然后,取第二個(gè)增量d2
圖示
Java代碼實(shí)現(xiàn)
packagesort;publicclassshellSort{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);intd=arr.length;inttemp;while(d>1){d/=2;for(inti=d;i
Python代碼實(shí)現(xiàn)
defshell_sort(a_list):#howmanysublists,alsohowmanyelementsinasublistsublist_count=len(a_list)//2whilesublist_count>0:forstart_positioninrange(sublist_count):gap_insertion_sort(a_list,start_position,sublist_count)print("Afterincrementsofsize",sublist_count,"Thelistis",a_list)sublist_count=sublist_count//2defgap_insertion_sort(a_list,start,gap):#start+gapisthesecondelementinthissublistforiinrange(start+gap,len(a_list),gap):current_value=a_list[I]position=Iwhileposition>=gapanda_list[position-gap]>current_value:a_list[position]=a_list[position-gap]#movebackwardposition=position-gapa_list[position]=current_valuea_list=[54,26,93,17,77,31,44,55,20,88]shell_sort(a_list)print(a_list)
算法分析
我們知道一次插入排序是穩(wěn)定的,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動(dòng),最后其穩(wěn)定性就會(huì)被打亂,所以希爾排序是不穩(wěn)定的。
希爾排序的時(shí)間性能優(yōu)于直接插入排序,原因如下:
(1)當(dāng)文件初態(tài)基本有序時(shí)直接插入排序所需的比較和移動(dòng)次數(shù)均較少。
(2)當(dāng)n值較小時(shí),n和n2的差別也較小,即直接插入排序的最好時(shí)間復(fù)雜度O(n)和最壞時(shí)間復(fù)雜度0(n2)差別不大。
(3)在希爾排序開始時(shí)增量較大,分組較多,每組的記錄數(shù)目少,故各組內(nèi)直接插入較快,后來增量di逐漸縮小,分組數(shù)逐漸減少,而各組的記錄數(shù)目逐漸增多,但由于已經(jīng)按di-1作為距離排過序,使文件較接近于有序狀態(tài),所以新的一趟排序過程也較快。
因此,希爾排序在效率上較直接插人排序有較大的改進(jìn)。
希爾排序的平均時(shí)間復(fù)雜度為O(nlogn)。
選擇排序
基本思想
每趟從待排序的記錄序列中選擇關(guān)鍵字最小的記錄放置到已排序表的最前位置,直到全部排完。
2.1 直接選擇排序
基本思想
在要排序的一組數(shù)中,選出最小的一個(gè)數(shù)與第一個(gè)位置的數(shù)交換;然后在剩下的數(shù)當(dāng)中再找最小的與第二個(gè)位置的數(shù)交換,如此循環(huán)到倒數(shù)第二個(gè)數(shù)和最后一個(gè)數(shù)比較為止。
圖示
Java代碼實(shí)現(xiàn)
packagesort;publicclassSelectionSort{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);for(inti=0;i
Python代碼實(shí)現(xiàn)
"""選擇排序"""defselection_sort(a_list):forfill_slotinrange(len(a_list)-1,0,-1):max_index=0foriinrange(1,fill_slot+1):ifa_list[i]>a_list[max_index]:max_index=Ia_list[max_index],a_list[fill_slot]=a_list[fill_slot],a_list[max_index]if__name__=='__main__':a_list=[54,26,93,17,77,31,44,55,20]selection_sort(a_list)print(a_list)
算法分析
簡單選擇排序是不穩(wěn)定的排序。
時(shí)間復(fù)雜度:T(n)=O(n^2)。
2.2 堆排序
基本思想
堆排序是一種樹形選擇排序,是對(duì)直接選擇排序的有效改進(jìn)。
、堆的定義下:具有n個(gè)元素的序列 (h1,h2,...,hn),當(dāng)且僅當(dāng)滿足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1) (i=1,2,...,n/2)時(shí)稱之為堆。在這里只討論滿足前者條件的堆。由堆的定義可以看出,堆頂元素(即第一個(gè)元素)必為最大項(xiàng)(大頂堆)。完全二 叉樹可以很直觀地表示堆的結(jié)構(gòu)。堆頂為根,其它為左子樹、右子樹。
初始時(shí)把要排序的數(shù)的序列看作是一棵順序存儲(chǔ)的二叉樹,調(diào)整它們的存儲(chǔ)序,使之成為一個(gè) 堆,這時(shí)堆的根節(jié)點(diǎn)的數(shù)最大。然后將根節(jié)點(diǎn)與堆的最后一個(gè)節(jié)點(diǎn)交換。然后對(duì)前面(n-1)個(gè)數(shù)重新調(diào)整使之成為堆。依此類推,直到只有兩個(gè)節(jié)點(diǎn)的堆,并對(duì) 它們作交換,最后得到有n個(gè)節(jié)點(diǎn)的有序序列。從算法描述來看,堆排序需要兩個(gè)過程,一是建立堆,二是堆頂與堆的最后一個(gè)元素交換位置。所以堆排序有兩個(gè)函數(shù)組成。一是建堆的滲透函數(shù),二是反復(fù)調(diào)用滲透函數(shù)實(shí)現(xiàn)排序的函數(shù)。
圖示
建堆
交換,從堆中踢出最大數(shù)
Java代碼實(shí)現(xiàn)
packagesort;publicclassHeapSort{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);heapSort(arr);System.out.println("");System.out.println("排序之后:");printArray(arr);}privatestaticvoidheapSort(int[]arr){//buildheapintN=arr.length;for(inti=N/2;i>=0;i--)perceDown(arr,i,N);for(inti=N-1;i>=0;i--){inttemp=arr[i];arr[i]=arr[0];arr[0]=temp;perceDown(arr,0,i);}}privatestaticvoidperceDown(int[]arr,inti,intN){//i:要替換的元素//N:終止的位置inttemp=arr[i];intchild=i*2+1;while(childarr[child])child=child+1;if(temp
Python代碼實(shí)現(xiàn)
defperceDown(a_list,i,N):temp=a_list[I]while(2*i+1)a_list[child]:child=child+1iftemp
算法分析
堆排序也是一種不穩(wěn)定的排序算法。
堆排序優(yōu)于簡單選擇排序的原因:直接選擇排序中,為了從R[1..n]中選出關(guān)鍵字最小的記錄,必須進(jìn)行n-1次比較,然后在R[2..n]中選出關(guān)鍵字最小的記錄,又需要做n-2次比較。事實(shí)上,后面的n-2次比較中,有許多比較可能在前面的n-1次比較中已經(jīng)做過,但由于前一趟排序時(shí)未保留這些比較結(jié)果,所以后一趟排序時(shí)又重復(fù)執(zhí)行了這些比較操作。
堆排序可通過樹形結(jié)構(gòu)保存部分比較結(jié)果,可減少比較次數(shù)。
堆排序的最壞[時(shí)間復(fù)雜度為O(nlogn)。堆序的平均性能較接近于最壞性能。由于建初始堆所需的比較次數(shù)較多,所以堆排序不適宜于記錄數(shù)較少的文件。
有關(guān)堆排序的知識(shí),可以參照另一篇帖子:https://www.jianshu.com/p/541d166ce6c2
交換排序
3.1 冒泡排序
基本思想
在要排序的一組數(shù)中,對(duì)當(dāng)前還未排好序的范圍內(nèi)的全部數(shù),自上而下對(duì)相鄰的兩個(gè)數(shù)依次進(jìn)行比較和調(diào)整,讓較大的數(shù)往下沉,較小的往上冒。即:每當(dāng)兩相鄰的數(shù)比較后發(fā)現(xiàn)它們的排序與排序要求相反時(shí),就將它們互換。
圖示
Java代碼實(shí)現(xiàn)
packagesort;publicclassBubbleSort{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);for(inti=0;i
Python代碼實(shí)現(xiàn)
defshort_bubble_sort(a_list):pass_num=len(a_list)-1exchanges=Truewhilepass_num>0andexchanges:exchanges=Falseforiinrange(pass_num):ifa_list[i]>a_list[i+1]:a_list[i],a_list[i+1]=a_list[i+1],a_list[I]exchanges=Truepass_num-=1
算法分析
冒泡排序是一種穩(wěn)定的排序方法。
若文件初狀為正序,則一趟起泡就可完成排序,排序碼的比較次數(shù)為n-1,且沒有記錄移動(dòng),時(shí)間復(fù)雜度是O(n)
若文件初態(tài)為逆序,則需要n-1趟起泡,每趟進(jìn)行n-i次排序碼的比較,且每次比較都移動(dòng)三次,比較和移動(dòng)次數(shù)均達(dá)到最大值∶O(n^2)
起泡排序平均時(shí)間復(fù)雜度為O(n^2)
3.2 快速排序
基本思想選擇一個(gè)基準(zhǔn)元素,通常選擇第一個(gè)元素或者最后一個(gè)元素,通過一趟掃描,將待排序列分成兩部分,一部分比基準(zhǔn)元素小,一部分大于等于基準(zhǔn)元素,此時(shí)基準(zhǔn)元素在其排好序后的正確位置,然后再用同樣的方法遞歸地排序劃分的兩部分。
圖示
Java代碼實(shí)現(xiàn)
packagesort;publicclassQuickSort{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);quickSort(arr,0,arr.length-1);System.out.println("");System.out.println("排序之后:");printArray(arr);}privatestaticvoidquickSort(int[]arr,intstart,intend){if(start=temp)right-=1;if(left<=?right){????????????????????????int?t?=?arr[left];????????arr[left]?=?arr[right];????????arr[right]?=?t;????}????????????????else????????break;}arr[start]?=?arr[right];arr[right]?=?temp;????????return?right;}????private?static?void?printArray(int[]?arr){????????for(int?x:arr){????System.out.print(x?+?"?");????}??}}
Python代碼實(shí)現(xiàn)
defquick_sort(a_list):quick_sort_helper(a_list,0,len(a_list)-1)defquick_sort_helper(a_list,first,last):iffirst
算法分析
快速排序是不穩(wěn)定的排序。
快速排序的時(shí)間復(fù)雜度為O(nlogn)。
當(dāng)n較大時(shí)使用快排比較好,當(dāng)序列基本有序時(shí)用快排反而不好。
歸并排序
基本思想歸并(Merge)排序法是將兩個(gè)(或兩個(gè)以上)有序表合并成一個(gè)新的有序表,即把待排序序列分為若干個(gè)子序列,每個(gè)子序列是有序的。然后再把有序子序列合并為整體有序序列。圖示
Java代碼實(shí)現(xiàn)
packagesort;publicclassMergeSort{publicstaticvoidmain(String[]args){int[]arr={49,38,65,97,76,13,27,49,78,34,12,64,1};System.out.println("排序之前:");printArray(arr);mergeSort(arr,0,arr.length-1);System.out.println("");System.out.println("排序之后:");printArray(arr);}privatestaticvoidmergeSort(int[]arr,intstart,intend){if(end-start>0){intmid=(end-start)/2+start;mergeSort(arr,start,mid);mergeSort(arr,mid+1,end);int[]temp=newint[arr.length];inttempIndex=start;intleft=start;intright=mid+1;while(left<=?mid?&&?right?<=?end){????????????????//從兩個(gè)數(shù)組中選取較小的數(shù)放入中間數(shù)組????????if(arr[left]?<=?arr[right])????????????temp[tempIndex++]?=?arr[left++];????????????????????????else????????????temp[tempIndex++]?=?arr[right++];????}????????????//將剩余的部分放入中間數(shù)組????while(left?<=?mid)????????temp[tempIndex++]?=?arr[left++];????????????????while(right?<=?end)????????temp[tempIndex++]?=?arr[right++];????????????????//將中間數(shù)組復(fù)制回原數(shù)組????tempIndex?=?start;????????????????while(tempIndex<=end)????????arr[tempIndex]?=?temp[tempIndex++];??}}????private?static?void?printArray(int[]?arr){????????for(int?x:arr){????System.out.print(x?+?"?");?????}??}}
Python代碼實(shí)現(xiàn)
defmerge_sort(a_list):print("Splitting",a_list)iflen(a_list)>1:mid=len(a_list)//2left_half=a_list[:mid]right_half=a_list[mid:]merge_sort(left_half)merge_sort(right_half)I=0j=0k=0whilei
算法分析
歸并排序是穩(wěn)定的排序方法。
歸并排序的時(shí)間復(fù)雜度為O(nlogn)。
速度僅次于快速排序,為穩(wěn)定排序算法,一般用于對(duì)總體無序,但是各子項(xiàng)相對(duì)有序的數(shù)列。
基數(shù)排序
基本思想將所有待比較數(shù)值(正整數(shù))統(tǒng)一為同樣的數(shù)位長度,數(shù)位較短的數(shù)前面補(bǔ)零。然后,從最低位開始,依次進(jìn)行一次排序。這樣從最低位排序一直到最高位排序完成以后,數(shù)列就變成一個(gè)有序序列。
圖示
Java代碼實(shí)現(xiàn)
packagecom.sort;//不穩(wěn)定importjava.util.Arrays;publicclassHeapSort{publicstaticvoidmain(String[]args){int[]a={49,38,65,97,76,13,27,49,78,34,12,64};intarrayLength=a.length;//循環(huán)建堆for(inti=0;i
Python代碼實(shí)現(xiàn)
fromrandomimportrandintdefradix_sort(lis,d):foriinxrange(d):#d輪排序s=[[]forkinxrange(10)]#因?yàn)槊恳晃粩?shù)字都是0~9,故建立10個(gè)桶forjinlis:s[j/(10**i)%10].append(i)li=[aforbinsforainb]returnli
算法分析
基數(shù)排序是穩(wěn)定的排序算法。
基數(shù)排序的時(shí)間復(fù)雜度為O(d(n+r)),d為位數(shù),r為基數(shù)。
整體分析
6.1 穩(wěn)定性
穩(wěn)定:冒泡排序、插入排序、歸并排序和基數(shù)排序
不穩(wěn)定:選擇排序、快速排序、希爾排序、堆排序
6.2 平均時(shí)間復(fù)雜度
O(n^2):直接插入排序,簡單選擇排序,冒泡排序。
在數(shù)據(jù)規(guī)模較小時(shí)(9W內(nèi)),直接插入排序,簡單選擇排序差不多。當(dāng)數(shù)據(jù)較大時(shí),冒泡排序算法的時(shí)間代價(jià)最高。性能為O(n^2)的算法基本上是相鄰元素進(jìn)行比較,基本上都是穩(wěn)定的。
O(nlogn):快速排序,歸并排序,希爾排序,堆排序。
其中,快排是最好的, 其次是歸并和希爾,堆排序在數(shù)據(jù)量很大時(shí)效果明顯。
6.3 排序算法的選擇
1.數(shù)據(jù)規(guī)模較小
(1)待排序列基本序的情況下,可以選擇直接插入排序;(2)對(duì)穩(wěn)定性不作要求宜用簡單選擇排序,對(duì)穩(wěn)定性有要求宜用插入或冒泡
2.數(shù)據(jù)規(guī)模不是很大
(1)完全可以用內(nèi)存空間,序列雜亂無序,對(duì)穩(wěn)定性沒有要求,快速排序,此時(shí)要付出log(N)的額外空間。(2)序列本身可能有序,對(duì)穩(wěn)定性有要求,空間允許下,宜用歸并排序
3.數(shù)據(jù)規(guī)模很大
(1)對(duì)穩(wěn)定性有求,則可考慮歸并排序。(2)對(duì)穩(wěn)定性沒要求,宜用堆排序
4.序列初始基本有序(正序),宜用直接插入,冒泡
-
JAVA
+關(guān)注
關(guān)注
19文章
2973瀏覽量
104904 -
python
+關(guān)注
關(guān)注
56文章
4801瀏覽量
84861
原文標(biāo)題:各種排序算法的分析及java&python實(shí)現(xiàn)
文章出處:【微信號(hào):atleadai,微信公眾號(hào):LeadAI OpenLab】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論