排序算法小结
总览
函数坐标图
排序算法对比图
类别 | 时间复杂度(平均) | 时间复杂度(最好) | 时间复杂度(最坏) | 空间复杂度(辅助存储) | 排序方式 | 稳定性 |
---|---|---|---|---|---|---|
冒泡排序(交换) | O(n2) | O(n) | O(n2) | O(1) | In-place | 稳定 |
快速排序(交换) | O(nlogn) | O(nlogn) | O(n2) | 看情况 | In-place | 不稳定 |
插入排序(插入) | O(n2) | O(n) | O(n2) | O(1) | In-place | 稳定 |
希尔排序(插入) | 根据步长序列 | O(n) | 根据步长序列 | O(1) | In-place | 不稳定 |
选择排序(选择) | O(n2) | O(n2) | O(n2) | O(1) | In-place | 不稳定 |
堆排序(选择) | O(nlogn)) | O(nlogn)) | O(nlogn)) | O(1) | In-place | 不稳定 |
归并排序 | O(nlogn)) | O(nlogn)) | O(nlogn)) | O(n) | Out-place | 稳定 |
计数排序 | O(n+k) | O(n+k) | O(n+k) | O(n+k) | Out-place | 稳定 |
桶排序 | O(n+k) | O(n+k) | O(n2) | O(n*k) | Out-place | 稳定 |
基数排序 | O(n*k) | O(n*k) | O(n*k) | O(n+k) | Out-place | 稳定 |
- n: 数据量
- k: 桶的个数
- In-place: 占用常数内存
- Out-place: 占用额外内存
- 稳定性:排序后 2 个相等键值的顺序和排序之前它们的顺序相同
冒泡排序(Bubble Sort)
1 | function bubbleSort(arr) { |
注:
- 冒泡排序是一种交换排序,核心是冒泡,把数组中最小的那个往上冒,冒的过程就是和他相邻的元素交换。
- 冒泡排序毕竟是一种效率低下的排序方法,在数据规模很小时,可以采用。
快速排序(Quick Sort)
1 | function quickSort(arr, left, right) { |
注:
- 递归分治法,随机选择一个元素作为中心点,其他值与中心点比较,左小右大进行分区,然后递归对两个区重复分区。
- 快速排序的最坏运行情况是 O(n²),比如说顺序数列的快排。但它的平摊期望时间是 O(n log n) ,且 O(n log n)记号中隐含的常数因子很小,比复杂度稳定等于 O(n log n)的归并排序要小很多。所以,对绝大多数顺序性较弱的随机数列而言,快速排序总是优于归并排序。
插入排序(Insertion Sort)
1 | function insertionSort(arr) { |
注:
- 插入排序是排序序列中从后向前扫描,找到相应位置并插入对应的未排序数据,类似斗地主理牌的情景。
- 插入排序不适合对于数据量比较大的排序应用。
希尔排序(Shell Sort)
1 | function shellSort(arr) { |
注:
- 希尔排序实质就是分组插入排序,插入排序的一种更高效率的实现,核心在于步长序列的设定。
- 最好步长序列至今还是数学难题,平均时间复杂度根据增量序列不同而不同。
选择排序(Selection Sort)
1 | function selectionSort(arr) { |
注:
- 与冒泡不同,冒泡排序是通过相邻的比较和交换,而选择排序是通过整体的选择,找到最大(小)值交换无序区起始位置。
- 算法稳定在
O(n²)
的时间复杂度。
堆排序(Heap Sort)
1 | function heapSort(arr) { |
注:
- 堆是具一个完全二叉树。
- 每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。
- 堆排序思想:将待排序序列构造成一个大顶堆,此时整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余 n-1 个元素重新构造成一个堆,这样会得到 n 个元素的次小值。如此反复执行,便能得到一个有序序列。
- 堆排序是一种选择排序,整体主要由构建初始堆+交换堆顶元素和末尾元素并重建堆两部分组成。
归并排序(Merge Sort)
1 | function mergeSort(arr) { |
注:
- 分而治之。
- 两种方式实现:分为自顶向下(递归)和自底向上(迭代)。
计数排序(Counting Sort)
1 | function countingSort(arr, maxValue) { |
注:
- 计数排序要求输入的数据必须是有确定范围的整数
- 计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中
桶排序(Bucket Sort)
1 | function bucketSort(arr, bucketSize) { |
注:
- 分治思想
- 桶排序基于计数排序,将数组的元素分布到多个桶中
- 对每个桶被单独地排序,应用其他排序方法
基数排序(Radix Sort)
1 | let counter = []; |
注:
- 基数排序是一种非比较的整数排序算法。
- 原理是将整数按位数切割成不同的数字,然后对每个位数上的数字进行分别比较(低位到高位)。
- 基数排序与计数排序、桶排序这三种排序算法都利用了桶的概念,并且都是线性时间非比较类排序(其他排序是非线性时间比较类排序)但对桶的使用方法上有明显差异:
- 基数排序:根据键值的每位数字来分配桶;
- 计数排序:每个桶只存储单一键值;
- 桶排序:每个桶存储一定范围的数值;
非线性时间比较类排序:通过比较来决定元素间的相对次序,由于其时间复杂度不能突破 O(nlogn),因此称为非线性时间比较类排序。
线性时间非比较类排序:不通过比较来决定元素间的相对次序,它可以突破基于比较排序的时间下界,以线性时间运行,因此称为线性时间非比较类排序。
总结
简单的排序
- 冒泡排序:循环遍历左右比较,较小的元素前移,较大的元素后移。
- 选择排序:在未排序序列中找到最小的元素一次性放到已排序序列的末端。
- 插入排序:从未排序序列中取出每一个元素,依次在已排序序列里从后向前扫描,插入到合适的位置。
高效的排序
- 快速排序:找到基准,进行分区操作(基准左边的小,右边大),递归对分区的分区继续进行分区操作,直至分区元素有序或则剩余一个元素。
- 堆排序:建堆,首尾交换,断尾,再建堆,直至最后一个元素。
- 希尔排序:本质上就是分组插入排序的一种更高效的改善型,希尔排序并非是每次一个元素挨着另一个元素的进行比较,它采用了较大的增量(也就是间隔几个元素而非 1 个元素);先将待排序序列分割成几个子序列,每个子序列间隔相同的特定的增量(几个元素),以跳跃式的方式进行插入排序;然后依次缩小增量再进行插入排序直至最后的增量为 1,对所有元素进行最后一次插入排序。
基于分治递归的排序
- 归并排序:两两分组进行排序,排序后两组合并再排序。
- 计数排序:用待排序的数作为计数数组的下标,统计每个数字的个数。然后依次输出即可得到有序序列。
- 桶排序:把每个数字按照一定的映射函数放到相应的桶中,然后对桶内的数字排序。
- 基数排序:所有待比较数值(正整数)先统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后,数列就变成一个有序序列。