顾名思义,快速排序的特点当然就是快。但其实如果单纯从复杂度的量级来看,快速排序并没有比归并排序更好,它们是同一个量级的算法,只不过它的常数通常会更小。毕竟N和10N、100N说起来都是一样的复杂度,但它们的运行时间却差了上百倍,所以即使是常数的差异也是可以很惊人的。
你可能在《算法导论》的课程或者是某本算法书上看过快排的原理,但也只是看过,可能没过两三天就忘在脑后了。
如果不幸被我言中也不用懊恼,学算法本就是一个曲折的过程。在今天的文章当中,我会试着帮你找到几个关键点,加深对它的印象,从而让你离亲自动手实现它更进一步。
分治和切分
快速排序和归并排序是一对好基友,虽然快速排序的名字里面没有归并或者是分治这两个字,但仍然不妨碍它拥有和归并排序一样的核心原理——分治法。
是的,你没有看过,快速排序也是基于分治的思想实现的。表面上看,分治好像只是做了一点无聊的操作,将一个数组拆分成了两个。但神奇的是,只要这个操作持续进行,就可以化整为零实现我们想要的目标。
在归并排序当中,这个操作是两个有序数组的归并,那么在快速排序当中,又是什么呢?
其实也很简单,这个操作叫做切分。
所谓切分也就是将数组根据指标K拆分成两个部分,其中小于等于K的一个部分,大于K的另外一个部分。比如我们有这么一个数组:
[10, 3, 9, 6, 5, 4, 2, 7]
我们选择的K是5,切分之后,我们把K放在中间,可以写成这样:
[3, 4, 2] 5 [10, 9, 6, 7]
显然,拆分之后的数组依然不是有序的。但我们可以肯定两点,第一:K的位置一定正确了,因为左边都是小于等于它的,右边都是大于它的,所以K切分之后摆放在了正确的位置。第二:切分之后得到的结果比之前更接近排序之后的结果。
从数学角度上来说,它的熵减小了,翻译成人话就是它的有序程度增加了,杂乱程度减小了。毕竟我们摆放好了K,而且让元素按照大小分成了两个部分。
我们来试着写一下切分的过程,我们先用Python来写,再用C++。因为在这个问题上,Python的语法简单很多:
为什么Python写起来更简单呢,因为Python可以更加方便地拆分和新建List,C++则要麻烦很多。
同样的代码在C++写出来是这样的:
从行数上来看,两者差不多,但C++用到了两指针,总体上更加复杂一些。
切分和排序
理解了切分之后,摆在我们面前的就只剩下了最后一个问题——怎么样用切分来排序呢?
其实我们已经很接近了,只不过少了一个步骤所以看起来还不太明显。我们将数组分成了两个部分,前半部分都小于等于K,后半部分都大于等于K。如果K本身就是数组中的元素,那么它是不是应该放在这两个部分中间?这个中间的位置是不是就是K排序之后应该在的位置?
所以我们一轮切分之后,至少可以确定把K放到应该在的位置。K的位置确定了之后,我们就可以采用分治法,对于K前面和K后面的部分分别如法炮制。只要这样一直操作下去,就一定可以保证数组当中的所有元素都有序。
不要再怀疑,的确如此。
我们来完整地写一下代码,我们先看Python版本的,它绝对比你想的更加简单:
在这段代码当中,我们默认选择数组的最后一个元素作为比较的K。其实用字母K表示不太严谨,正规的叫做叫做pivot,翻译过来就是枢纽、转轴的意思。为了便于大家理解,所以没有在一开始的时候介绍过多的概念。
选择了K之后,我们创建两个数组分别存储小于等于K的和大于K的元素。最后,返回的时候把K放在了两者之间。为什么说Python很方便呢,因为Python可以很轻松地对整个数组进行加法操作:
return sort(le) + [K] + sort(gt)
这里一行代码,就把递归和数组拼接全部实现了。
Python的实现方式固然非常方便,但会增加算法的开销。因为创建新的数组、数组销毁,以及数组的合并这些操作都是有开销的。
在C++的版本当中,我们直接在原数组上操作,而非拷贝拼接的方式来执行。除了性能更好之外,也可以避免额外的空间消耗。但代价就是整体的代码会稍微复杂一些。
其他逻辑和之前的 cut
一样,注意一下最后一行,它等价于:
nums[r] = nums[j];nums[j] = K;
由于我们选择了最后一个元素作为K,所以在顺序调整之后,我们要把它放在正确的位置,即右侧指针j最后停留的位置。
如果大家在面试中遇到手写快排的问题,不妨可以选择Python版本。因为它实现更加简单,不容易出错。而在日常的比赛或者是学习当中,建议还是选择C++版本,因为它性能更好,也是更常规更标准的实现方式。