算法是一门关于性能(performance)和资源消耗(resource usage)的科学。其中我们主要关注的是性能,改善算法设计有助于提高程序运行性能。
性能的价值就像是货币,货币是购买其它生活必需品的前提,而性能就是变现为计算机系统用户友好性,安全性,可靠性等的前提。
性能是导致一份代码是否具有可行性的原因,如果我们沉迷于不停地重新实现十年前别人已经实现过的东西,那么工作将是机械性的。如果我们专注于改进算法以提供更好的性能,那么工作将是具有突破性的。
算法数学提供了描述程序行为的统一的简单的方法。
算法充满了乐趣!:) (fast)
衡量一个算法好坏的方法是计算 算法运行时间,以下先明确几个点:
一个算法的运行时间取决于:输入。
参数化算法运行时间的方法是:输入的大小,即T(n)。
通常我们会寻找:算法运行时间的上界,作为一种对算法效率的保障。
上面说到,我们通常会寻找算法运行时间的上界来作为对算法效率的衡量,这里我们系统给出对算法效率进行衡量的方法。
`T(n) = ` 对于任何输入大小 `n` 的算法的最长运行时间。
在对输入大小 `n` 的概率分布有做假设的前提下,`T(n) = ` 对于所有输入大小 `n` 的算法的期望运行时间。
最好情况通常用于说明一个慢的算法在某些特定的输入条件下比其它算法运行得更快。
通常,当我们讨论一个算法的运行时间时,我们总是在讨论最长运行时间。
当我们在单纯讨论一种算法的效率的时候,我们必须抛除不同机器配置所造成的影响,因此我们必须明确我们所重点关注的是 Machine-independent Time。基本思想就是忽视一切和机器有关的常量,在评估一个算法的时候,我们通过关注 `T(n)` 在 `n \to \infty` 时的增长情况,来横向比较不同算法的效率,这种方法称为 渐近分析 (Asymptotic Analysis)。
在关于算法的渐进分析分析中,为了满足我们只关注 `T(n)` 增长的需求,我们经常使用数学符号 `\Theta` (theta) (我们在下一节将会对其详细展开讨论)。在工程的定义上,对于一个关于 `n` 的多项式,`\Theta` 的意义是弃去所有低阶项且忽略所有常数因子,如 `3n^3 + 90n^2 - 5n + 6046 = \Theta(n^3)`。
我们以上图为例,我们可以知道一个时间复杂度为 `\Theta(n^2)` 的算法一定会在 `n` 大于某个值 `n_0` 后优于时间复杂度为 `\Theta(n^3)` 的算法。但是在实际工程里,我们通常还需要观察这个 `n_0` 值是不是在可接受范围内的值,如果它是一个过于庞大的数,那么明显地我们可能还是得选择 `\Theta(n^3)` 的算法,因此不能忽视时间复杂度在数学上体现相对较高的算法。
从数组的第一个元素开始,提取出每一个元素,基于前面已排序的部分,找到合适的位置将其插入进去。
INSERTION-SORT (A, n) ⊳A[1 . . n]
for j ← 2 to n
do key ← A[j]
i ← j–1
while i > 0 and A[i] > key
do A[i+1] ← A[i]
i ← i–1
A[i+1] = key
def insert_sort(array: list) -> list:
for j in range(1, len(array)):
key = array[j]
i = j - 1
while i >= 0 and array[i] > key:
array[i+1] = array[i]
array[i] = key
i -= 1
array[i+1] = key
return array
(a) 最差情况:输入的所有元素是倒序的,那么由于外层循环了 `2 \to n` 次,每个循环里又做了 `\Theta(j)` 次循环,因此我们可以得到:`T(n) = \sum_{j=2}^{n}\Theta(j) = \Theta(n^2)` (算术级数求和)
(b) 平均情况:输入的组合的各种可能性是相等的(平均分布),那么由于由于外层循环了 `2 \to n` 次,每个循环里平均做了 `\Theta((1+(j-1))/2) = \Theta(j/2)` 次循环,因此我们可以得到:`T(n) = \sum_{j=2}^{n}\Theta(j/2) = \Theta(n^2)`
获取一个输入数组,将其等分为两个子数组进行排序,然后对这两个sorted的子数组进行排序合并,并且如此递归。如上图所示,按序合并两个sorted的子数组是很简单的一件事情,只需要按序比较两个子数组还未被合并部分的第一个元素即可,即每个元素的排序都只涉及一次比较,因此效率会很高。
`MERGE-SORT \quad A[1 . . n]`
STEP 1. 如果 `n = 1`, 那么直接返回 `A[1 . . n]`。
STEP 2. 提取出 `A[1 ... n/2]` 和 `A[n/2+1 ... n]` 前后两个子列表,递归地将这两个子列表进行排序(调用自身函数对这两个子列表继续进行排序),即`MERGE-SORT \quad A[1 ... n/2]` 和 `MERGE-SORT \quad A[n/2+1 ... n]`。
STEP 3. “Merge” 两个sorted的子列表。此部分即按序比较两个子数组还未被合并部分的第一个元素即可,所以每个元素的排序都只涉及一次比较。
def merge_sort(array: list) -> list:
# 如果长度为1,直接返回
if len(array) == 1:
return array
# 提取出数组的前半部分和后半部分
first_half_array = array[0:int(len(array)/2)]
second_half_array = array[int(len(array)/2):len(array)]
# 递归调用归并排序代码,获得排序好的前半部分和后半部分
sorted_first_half_array = merge_sort(first_half_array)
sorted_second_half_array = merge_sort(second_half_array)
# 合并sorted的前半部分和后半部分
i = 0
j = 0
new_array = []
while i < len(sorted_first_half_array) or j < len(sorted_second_half_array):
if i < len(sorted_first_half_array) and j < len(sorted_second_half_array):
if sorted_first_half_array[i] < sorted_second_half_array[j]:
new_array.append(sorted_first_half_array[i])
i += 1
else:
new_array.append(sorted_second_half_array[j])
j += 1
continue
if i < len(sorted_first_half_array):
new_array.append(sorted_first_half_array[i])
i += 1
if j < len(sorted_second_half_array):
new_array.append(sorted_second_half_array[j])
j += 1
return new_array
设 `MERGE-SORT \quad A[1 . . n]` 的时间复杂度为 `T(n)`,然后我们分别对 (2) 基本步骤 中提到的每一步进行复杂度分析。
STEP 1: 在这一步中只做了若干次比较操作,因此 `T_1(n) = \Theta(1)`;
STEP 2: 在这一步中,我们分别对两个子列表递归进行了递归排序,因此我们可以得到 `T_2(n) = T(\ceil(n/2)) + T(\floor(n/2))`,其中`\ceil` 和 `\floor` 分别代表向上取整和向下取整,但是由于在渐进分析中影响不大,所以可以简单写为`T_2(n) = 2 T(n/2)`;
STEP 3: 在这一步中,我们合并了两个排序好的子列表,循环次数的规模是n,因此可以得到 `T_3(n) = \Theta(n)`;
综上,我们可以得到,
① `T(n)=\Theta(1), if n = 1`
② `T(n)=2T(n/2) + \Theta(n) if n > 1`
在算法的讨论中,我们通常会忽略如①所示的常数解,因为对于一个常数规模的输入,算法通常只需要常数规模的运行时间,因此①所示的常数输入情况通常对递归解不产生影响。接下来我们将重点关注②式,它是一个递归式,我们在本节将使用递归树的方法来解出这个递归式,下面对其进行讨论。