图算法：最小生成树

最小生成树问题是图算法问题中一类经典的问题，其在大量其他的图算法问题中也有广泛的应用。最小生成树问题，其核心是“贪心策略”在图算法中的应用，并由此产生了两类经典的最小生成树算法：Prim算法&Kruskal算法。

本文内容概要：

最小生成树问题背景及通用框架
Prim算法
Kruskal算法

1. 最小生成树问题背景及通用框架

1.1 问题引入：

实例：城市间道路修建问题——需要修建道路连通城市，各道路花费不同，求解连通各城市的最小花费是多少？

1.2 问题定义：

定义-1.1 子图（Subgraph）： 如果 $V'\subseteq V, E'\subseteq E$ ，则称图 $G'=(V',E')$ 是图 $G=(V,E)$ 的一个子图；
定义-1.2 生成子图（Spanning Subgraph）： 如果 $V'= V, E'\subseteq E$ ，则称图 $G'=(V',E')$ 是图 $G=(V,E)$ 的一个生成子图；

定义-1.3 生成树（Spanning Tree）： 图 $T'=(V',E')$ 是无向图图 $G=(V,E)$ 的一个生成子图，并且是连通、无环的（树）；

P.s：权重最小的生成树可能不唯一！（但如果各条边权重各不相同，则最小生成树唯一）

定义-1.4 最小生成树问题（Minimum Spanning Tree Problem）：

输入：连通的无向图 $G=(V,E,W)$ ，其中 $w(u,v)\in W$ 表示边 $(u,v)$ 的权重；
输出：无向图 $G=(V,E,W)$ 的最小生成树 $T=(V_T,E_T)$ ，
* 优化目标： $min \sum_{e\in E_T} w(e)$
* 约束条件： $s.t. \ V_T=V,E_T\subseteq E$

1.3 通用框架

需要注意的是，由于最小生成树是原图的一个生成子图。因此，求解最小生成树，其实质是求原图中属于最小生成树的边集。

问题1：如何保证边集𝑨仍是最小生成树的子集？
定义-1.5 安全边（Safe Edge）：
* 𝑨是某棵最小生成树𝑻边的子集，𝑨 ⊆ 𝑻
* 𝑨 ∪ {(𝒖, 𝒗)} 仍是 𝑻 边的一个子集，则称(𝒖, 𝒗)是𝑨的安全边

回答1：若每次向边集𝑨中新增安全边，可保证边集𝑨是最小生成树的子集。可将框架具体为：

问题2：如何有效辨识安全边？
定义-1.6 割（Cut）： 图𝑮 =(𝑽, 𝑬)是一个连通无向图，割(𝑺, 𝑽 − 𝑺)将图𝑮的顶点集𝑽划分为两部分。

定义-1.7 横跨（Cross）： 给定割(𝑺, 𝑽 − 𝑺)和边(𝒖, 𝒗)，𝒖 ∈ 𝑺, 𝒗 ∈ 𝑽 − 𝑺，称边横跨(𝒖, 𝒗)割(𝑺, 𝑽 − 𝑺)

定义-1.8 轻边（Light Edge）： 横跨割的所有边中，权重最小的称为横跨这个割的一条轻边。

定义-1.9 不妨害（Respect）： 如果一个边集𝑨中没有边横跨某割，则称该割不妨害边集𝑨。

安全边辨识定理：
前提：给定图𝑮 =(𝑽, 𝑬 )是一个带权的连通无向图，令𝑨是边集𝑬的一个子集，且𝑨包含在图𝑮的某棵最小生成树中。
内容：
* 若割(𝑺, 𝑽 − 𝑺)是图𝑮中不妨害边集𝑨的任意割，且(𝒖, 𝒗)是横跨该割的轻边；
* 则对于边集𝑨，边(𝒖, 𝒗)是其安全边。

综上所述，我们可将通用框架作如下总结：

即：

保证无环；
找轻边。

2. Prim算法

Prim算法是我们以上总结的求解最小生成树通用框架策略的一种具体实现，具体而言该方法主要着眼于“节点”的角度。其思想概括如下：

保证无环——始终保持一棵树
找轻边——优先队列求轻边

2.1 算法思想：

步骤1：选择任意一个顶点，作为生成树的起始顶点；
步骤2：保持边集𝑨始终为一棵树，选择割( $𝑽_𝑨$ , 𝑽 − $𝑽_𝑨$ )；
步骤3：选择横跨割( $𝑽_𝑨$ , 𝑽 − $𝑽_𝑨$ )的轻边，添加到边集𝑨中；
步骤4：重复步骤2和步骤3，直至覆盖所有顶点。

2.2 算法实现：

为便于算法描述，仍借用辅助数组标记各节点状态以及横跨割的边的权重：

𝒄𝒐𝒍𝒐𝒓数组：表示顶点状态
- Black——节点已覆盖， $u\in 𝑽_𝑨$
- White——节点未覆盖， $u\in 𝑽-𝑽_𝑨$
𝒑𝒓𝒆𝒅记录前驱节点：
- (𝒑𝒓𝒆𝒅[𝒖], 𝒖)即为最小生成树的边
𝒅𝒊𝒔𝒕记录横跨割( $𝑽_𝑨$ $V_{A}$ , 𝑽 − $𝑽_𝑨$ $V_{A}$ )的边的权重：
- 𝒅𝒊𝒔𝒕[u]——顶点集 $𝑽_𝑨$ 到顶点𝒖的最短距离，即：𝒅𝒊𝒔𝒕[u]=𝐦𝐢𝐧 {𝒘(𝒙, 𝒖)},∀𝒙∈ $𝑽_𝑨$ ；
- 轻边——𝐦𝐢𝐧{𝒅𝒊𝒔𝒕[𝒖]}, ∀𝒖 ∈ 𝑽− $𝑽_𝑨$

2.3 算法实例：

不妨设 $a$ 为起始节点：

在横跨割的候选边中选轻边，并加入边集中：

更新横跨割的候选边：

...
最终求得最小生成树：

2.4 算法伪代码：

首先我们给出算法直观地伪代码，如下：

可见，直观地实现Prim算法，其复杂度为 $O(|V|^2)$ 。然而，我们发现：在找轻边的过程中，我们可以采用优先队列这一数据结构简化算法复杂度：
P.s：关于优先队列——通过二叉堆进行实现：

改进后伪代码如下：

可见，利用优先队列改进后，Prim算法复杂度为 $O(|E|.log|V|)$