参考自:
- 《决策单调性与四边形不等式》,彭思进,感谢 Itst 的耐心答疑/bx
- 《决策单调性与四边形不等式 - 学习笔记》,p_b_p_b 的博客
一、决策单调性与四边形不等式
-
定义 1.1(子矩阵):设 \(A\) 是 \(n\times m\) 的矩阵。
定义子矩阵 \(A_{[i_1,\cdots,i_k],[j_1,\cdots,j_l]}\) 为 \(A\) 的第 \(i_1,\cdots,i_k\) 行和第 \(j_1,\cdots,j_l\) 列的交集组成的矩阵。
定义连续子矩阵 \(A_{[i_1\sim i_2],[j_1\sim j_2]}\) 为 \(A_{[i_1,i_1+1,\cdots,i_2],[j_1,j_1+1,\cdots,j_2]}\)。
-
定义 1.2(行最小值位置):定义 \(\min_i(A)\) 为矩阵 \(A\) 第 \(i\) 行最后一个最小值的位置。
-
定义 1.3(单调矩阵):称 \(n\times m\) 的矩阵 \(A\) 是单调的,当且仅当对于任意 \(1\leq i<n\) 有 \(\min_i(A)\leq \min_{i+1}(A)\)。
称矩阵 \(A\) 是完全单调的,当且仅当其所有子矩阵都是单调的。
-
定义 1.4(四边形不等式与蒙日矩阵):称 \(n\times m\) 的矩阵 \(A\) 满足四边形不等式,当且仅当对于任意 \(1\leq i_1<i_2\leq n\) 和 \(1\leq j_1<j_2\leq m\) 有 \(A_{i_1,j_1}+A_{i_2,j_2}\leq A_{i_1,j_2}+A_{i_2,j_1}\)。此时亦称 \(A\) 为蒙日矩阵。
-
引理 1.5:\(n\times m\) 的矩阵 \(A\) 满足四边形不等式,当且仅当对于任意 \(1\leq i<n\) 和 \(1\leq j<m\) 有 \(A_{i,j}+A_{i+1,j+1}\leq A_{i,j+1}+A_{i+1,j}\)。
证明:\(A_{i,j}+A_{i+1,j+1}-A_{i,j+1}-A_{i+1,j+1}\leq 0\),可以想象成 \(A\) 是另一个矩阵 \(B\) 的二维前缀和,而这句话描述的是 \(B_{i+1,j+1}\leq 0\)。那么原条件就转为一个矩阵范围内所有数的和 \(\leq 0\),这样看来就显然了。
-
引理 1.6:若矩阵 \(A\) 满足四边形不等式,则 \(A\) 是完全单调矩阵。
证明:反证。设 \(A\) 的子矩阵 \(A'\) 不是单调矩阵。\(A'\) 应当也满足四边形不等式。设 \(i\) 使得 \(\min_i(A')>\min_{i+1}(A')\),那么 \(A'_{i,\min_{i+1}(A')}+A'_{i+1,\min_i(A')}>A'_{i,\min_i(A')}+A'_{i+1,\min_{i+1}(A')}\),矛盾。
-
引理 1.7:若矩阵 \(A\) 满足四边形不等式,那么给 \(A\) 的一行/一列加上同一个数后 \(A\) 仍满足四边形不等式。
-
引理 1.8:若矩阵 \(A\) 满足四边形不等式,则 \(A^{\mathsf T}\) 也满足四边形不等式。
四边形不等式在动态规划中有以下两种经典应用:
-
定义 1.9(离线决策单调性):考虑如下动态规划(忽略初始值):
\[f_{i}=\min_{1\leq j<i}g_{j}+w_{j,i} \]其中矩阵 \(w\) 满足四边形不等式。
我们可以构造矩阵 \(A\):
\[A_{i,j}=\begin{cases}g_{j}+w_{j,i}&j<i\\\infty&j\geq i\end{cases} \]那么 \(f_{i}=A_{i,\min_i(A)}\)。
-
定义 1.10(在线决策单调性):考虑如下动态规划(忽略初始值):
\[f_{i}=\min_{1\leq j<i}f_{j}+w_{j,i} \]其中矩阵 \(w\) 满足四边形不等式。
类似地构造矩阵 \(A\):
\[A_{i,j}=\begin{cases}f_{j}+w_{j,i}&j<i\\\infty&j\geq i\end{cases} \]那么 \(f_{i}=A_{i,\min_i(A)}\)。
二、决策单调性的决策点计算
分治法
对于单调矩阵 \(A\),定义分治过程 solve(l,r,L,R)
表示计算 \(\min_l(A),\cdots,\min_r(A)\),且已知它们都在范围 \([L,R]\) 内。那么我们找到 \(mid=\lfloor\frac{l+r}{2}\rfloor\),暴力枚举 \([L,R]\) 并计算 \(M=\min_{mid}(A)\),然后递归 solve(l,mid-1,L,M)
和 solve(mid+1,r,M,R)
。边界条件 \(l>r\) 或 \(L=R\)。
假设求 \(A_{i,j}\) 是 \(O(1)\) 的,那么该算法的时间复杂度为 \(O(m\log n+n)\)。而可以证明对于单调矩阵求其所有 \(\min_i(A)\) 的计算复杂度下界是 \(O(m\log n)\) 的。
当 \(A_{i,j}\) 不能直接求时,分治法还能做另一种情况:假设我们知道了格子 \(A_{i,j}\) 的值后能据此快速地转移到某个相邻格子并知道它的值,那么考虑维护一个指针 \(i,j\) 和它的值,每次要求 \(A_{x,y}\) 时就逐步转移过去。考虑这么做的时间复杂度,容易发现在 solve(l,r,L,R)
节点上的移动次数是不超过 \(O(r-l+R-L)\) 的,而递归树上每一层相当于若干个对角相接的连续子矩阵,所以若单次移动的复杂度是 \(O(1)\),总时间复杂度仍然是 \(O((n+m)\log n)\) 的。
二分栈法
二分栈法可以解决在线决策单调性问题。
-
引理 2.1:矩阵 \(A\) 是完全单调矩阵等价于对于任意 \(i\) 和 \(j<k\) 有 \(A_{i,j}\geq A_{i,k}\implies A_{i+1,j}\geq A_{i+1,k}\)。
证明:若 \(A\) 是完全单调矩阵,且存在 \(i\) 和 \(j<k\) 使得 \(A_{i,j}\geq A_{i,k}\) 且 \(A_{i+1,j}<A_{i+1,k}\),则子矩阵 \(A_{[i,i+1],[j,k]}\) 不是单调矩阵,矛盾。
若对于任意 \(i\) 和 \(j<k\) 有 \(A_{i,j}\geq A_{i,k}\implies A_{i+1,j}\geq A_{i+1,k}\),则任意子矩阵 \(A'\) 显然是单调矩阵。
-
定义 2.2(冗余的):设 \(A\) 是单调矩阵。称 \(A_{i,j}\) 是冗余的,当且仅当 \(j\neq \min_i(A)\)。
称 \(A\) 的第 \(j\) 列是冗余的,当且仅当 \(A_{[1\sim n],j}\) 是冗余的。
二分栈法中维护了一个数 \(k\),并归纳地进行如下假设:
- 用栈维护好 \(A_k=A_{[1\sim n],[1\sim k]}\) 的非冗余列 \(j_1,\cdots,j_{top}\),且对于每个非冗余列 \(j\) 使得 \(\min_i(A_k)=j\) 的 \(i\) 为一个区间 \([l_j,r_j]\),且满足 \(l_{j_1}=1,r_{j_1}+1=l_{j_2},\cdots,r_{j_{top-1}}+1=l_{j_{top}},r_{j_{top}}=n\)。
- 已经维护好 \(f_1,\cdots,f_{k}\) 的值,于是 \(A_k\) 中每个元素的值都是知道的。
考虑 \(k\to k+1\):
- 由于 \(f_{k+1,y}=\infty(y\geq k+1)\),所以 \(\min_{k+1}(A)\leq k\),于是 \(\min_{k+1}(A)=\min_{k+1}(A_{k})\),那么直接通过栈上二分求出 \(\min_{k+1}(A_{k})\) 并据此得到 \(f_{k+1}\)。
- 利用引理 2.1 的性质,我们不断弹栈并在最后一次二分找到一段后缀使得这段后缀对应的行最小值位置为 \(k+1\),然后若这段后缀非空则把 \(k+1\) 加入栈中。
时间复杂度 \(O(n\log n)\)。
SMAWK 算法
算法的大致思路是:由于行最小值位置单调,那么只要我们确定偶数行的行最小值位置,就可以 \(O(m)\) 把奇数行的行最小值位置求出。然后利用此点递归处理。
为了使递归时 \(m\) 也能折半,我们要实现子过程 reduce(A)
,它传入一个 \(n\times m\) 的完全单调矩阵 \(A\),删除若干一定冗余的列,并返回一个 \(n\times \min(n,m)\) 的子矩阵。
reduce(A)
过程维护了两个数 \(k,j\),并归纳地进行如下假设:
- 维护了 \(k\) 个数 \(1\leq s_1<\cdots<s_k\leq j\),记它们形成的集合为 \(S\)。满足对于任意 \(1\leq j'\leq j\) 且 \(j'\not\in S\),第 \(j'\) 列是冗余的;对于任意 \(1\leq t\leq k\),\(A_{[1\sim t-1],s_t}\) 是冗余的。
考虑 \(j\to j+1\):
-
根据引理 2.1,当我们对两列 \(j_1<j_2\) 进行比较时,存在找到一个分界点 \(M\),使得对于任意 \(i\geq M\) 有 \(A_{i,j_1}\geq A_{i,j_2}\),即 \(A_{[M\sim n],j_1}\) 是冗余的;对于任意 \(i<M\) 有 \(A_{i,j_1}<A_{i,j_2}\),即 \(A_{[1\sim M-1],j_2}\) 是冗余的。
即我们能找到一个形状覆盖掉一些冗余的部分。
那么考虑比较列 \(s_k,j+1\),但我们只比较 \(A_{k,s_k}\) 和 \(A_{k,j+1}\),以得到 \(M\) 和 \(k\) 的大小关系,具体地:
- 若 \(A_{k,s_k}\geq A_{k,j+1}\),则 \(A_{[k\sim n],s_k}\) 是冗余的,结合 \(A_{[1\sim k-1],s_k}\) 是冗余的假设,可以知道第 \(k\) 列是冗余的,直接 \(k\gets k-1\) 并重新比较列 \(s_k,j+1\)。
- 若 \(A_{k,s_k}<A_{k,j+1}\),则 \(A_{[1\sim k],j}\) 是冗余的,在 \(k<n\) 的情况下将 \(j\) 置为 \(s_{k+1}\)。
所以通过 \(O(n+m)\) 的时间就能保留至多 \(\min(n,m)\) 个非冗余的列。
那么容易分析得出 SMAWK 算法的时间复杂度是 \(O(n+m)\) 的。
Wilber 算法
能线性解决形如定义 1.10 中的在线决策单调性问题。
咕。
Eppstein 算法
能线性解决下面形式的交错决策单调性问题:
\[f_i=\min_{1\leq j<i}g_j+w_{j,i}\\ g_i=\min_{1\leq j<i}f_j+w'_{j,i} \]咕。
三、二维决策单调性
最优搜索树问题
-
定义 3.1(区间单调性):称 \(n\times n\) 的矩阵 \(A\) 具有区间单调性,当且仅当对于任意 \(i\leq i'\leq j'\leq j\) 有 \(w_{i',j'}\leq w_{i,j}\)。
-
定义 3.2(最优搜索树问题):考虑如下形式的动态规划:
\[f_{i,j}=\begin{cases}w_{i,i}&i=j\\w_{i,j}+\min\limits_{i\leq k<j}(f_{i,k}+f_{k+1,j})&i<j\\\infty&i>j\end{cases} \]其中矩阵 \(w\) 满足四边形不等式和区间单调性。
对于 \(i<j\),定义 \(f_{i,j}\) 的最优转移点 \(K_{i,j}\) 为使得 \(f_{i,j}=w_{i,j}+\min\limits_{i\leq k<j}(f_{i,k}+f_{k+1,j})\) 的最大的 \(k\)。
对于 \(i<j\),设 \(f_{i,j,y}\) 表示 \(w_{i,j}+f_{i,y}+f_{y+1,j}\),那么 \(f_{i,j}=\min\limits_{i\leq y<j}f_{i,j,y}\)。
本文将在定义 3.2 的基础上讨论如何解决该问题。
-
引理 3.3:矩阵 \(f\) 满足四边形不等式。
证明:只需证明对任意 \(i\leq i'\leq j\leq j'\) 都有 \(f_{i,j}+f_{i',j'}\leq f_{i,j'}+f_{i',j}\) 即可。
对 \(len=j'-i\) 归纳,假设 \(len-1\) 成立。
-
当 \(i=i'\) 或 \(j=j'\) 时,等式两端相同。
-
当 \(i'=j=m\) 时,考虑证明 \(f_{i,m}+f_{m,j'}\leq f_{i,j'}+f_{m,m}\)。
设 \(K_{i,j'}\) 为 \(y\),不妨设 \(y< m\)。那么:
\[\begin{aligned} f_{i,m}+f_{m,j'}&\leq f_{i,m,y}+f_{m,j'}\\ &\leq (w_{i,m}+f_{i,y}+f_{y+1,m})+f_{m,j'}\\ &= w_{i,m}+f_{i,y}+(f_{y+1,m}+f_{m,j'})\\ &\leq w_{i,j'}+f_{i,y}+(f_{y+1,j'}+f_{m,m})\\ &=f_{i,j'}+f_{m,m} \end{aligned} \]其中利用了区间单调性 \(w_{i,m}\leq w_{i,j'}\) 和归纳假设 \(f_{y+1,m}+f_{m,j'}\leq f_{y+1,j'}+f_{m,m}\)。
-
当 \(i'<j\) 时,设 \(K_{i,j'}=y\) 和 \(K_{i',j}=z\) 且 \(y\leq z\)。那么:
\[\begin{aligned} f_{i,j}+f_{i',j'}&\leq f_{i,j,y}+f_{i',j',z}\\ &\leq (w_{i,j}+f_{i,y}+f_{y+1,j})+(w_{i',j'}+f_{i',z}+f_{z+1,j'})\\ &=(w_{i,j}+w_{i',j'})+f_{i,y}+f_{i',z}+(f_{y+1,j}+f_{z+1,j'})\\ &\leq (w_{i,j'}+w_{i',j})+f_{i,y}+f_{i',z}+(f_{y+1,j'}+f_{z+1,j})\\ &=(w_{i,j'}+f_{i,y}+f_{y+1,j'})+(w_{i',j}+f_{i',z}+f_{z+1,j})\\ &=f_{i,j'}+f_{i',j} \end{aligned} \]其中利用了 \(w\) 的四边形不等式 \(w_{i,j}+w_{i',j'}\leq w_{i,j'}+w_{i',j}\) 和归纳假设的 \(f_{y+1,j}+f_{z+1,j'}\leq f_{y+1,j'}+f_{z+1,j}\)。
-
-
引理 3.4:对于任意 \(1<i<j<n\),有 \(K_{i-1,j}\leq K_{i,j}\leq K_{i,j+1}\)。
证明:只考虑 \(K_{i,j}\leq K_{i,j+1}\)。构造矩阵 \(A\):
\[A_{j,k}=\begin{cases}w_{i,j}+f_{i,k}+f_{k+1,j}&i\leq k<j\\\infty&\text{otherwise}\end{cases} \]那么 \(K_{i,j}=\min_j(A)\)。
结合引理 3.3、引理 1.6 和引理 1.8 可知 \(\{w_{k+1,j}\}_{j,k}\) 是完全单调矩阵,再根据引理 1.7 得到 \(A\) 是完全单调矩阵,所以 \(K_{i,j}\leq K_{i,j+1}\) 得证。
根据引理 3.4,我们能在 \(O(n^2)\) 的时间复杂度内解决最优搜索树问题:考虑按区间长度从小到大求 \(f\),设当前已经求出了长度不超过 \(len\) 的 \(f\),那么对于 \(f_{i,i+len}\),我们只需在 \([K_{i,i+len-1},K_{i+1,(i+1)+len-1}]\) 中遍历决策点即可。那么对该种 \(len\) 求出所有 \(f\) 的时间复杂度是 \(O(n)\) 的。
四、决策单调性最短路问题
决策单调性最短路问题
-
定义 4.1(决策单调性最短路问题):考虑如下形式的动态规划:
\[f_{i,j}=\min_{1\leq k<j}f_{i-1,k}+w_{k,j} \]其中 \(w\) 满足四边形不等式。
-
定义 4.2(最短路):在决策单调性问题中,定义 \(s\) 到 \(t\) 的一条长度为 \(k\) 的最短路为序列 \(p_1,\cdots,p_{k+1}\),使得 \(s=p_1<p_2<\cdots<p_{k}<p_{k+1}=t\) 且 \(w_{p_1,p_2}+\cdots+w_{p_k,p_{k+1}}=f_{k,t}\),其中动态规划的初始值为 \(f_{0,s}=0\)。
结合前面的内容,直接利用 SMAWK 算法即可得到 \(O(nk)\) 的做法。我们将在下文介绍一些扩展解法。
答案凸性
但如果要求单点 \(f_{k,n}\) 的话,我们可以有一些扩展的做法:(下面记 \(f(k)=f_{k,n}\))
-
引理 4.3:对于任意 \(1\leq s<r<t\leq n-1\),\(f(r)+f(s+t-r)\leq f(s)+f(t)\)。
证明:考虑任意一条长度为 \(s\) 的最短路方案 \(p_1,\cdots,p_{s+1}\) 和任意一条长度为 \(t\) 的最短路方案 \(q_1,\cdots,q_{t+1}\)。
记 \(v=r-s\),那么一定存在 \(i\) 使得 \(p_i\leq q_{i+v}<q_{i+v+1}\leq p_{i+1}\):可以考虑 \(p_1,\cdots,p_s\)(\(s\) 个点)和 \(q_{1+v},\cdots,q_{s+v+1}\)(\(s+1\) 个点),由于 \(p_1\leq q_{1+v}\) 且 \(q_{s+v+1}\leq p_s\),那么由鸽巢原理,容易找到第一个位置使得 \(p_i\leq q_{i+v}<q_{i+v+1}\leq p_{i+1}\)。
此时将两条边 \(\begin{cases}s:p_i\to p_{i+1}\\t:q_{i+v}\to q_{i+v+1}\end{cases}\) 端点交换,即可得到 \(\begin{cases}r:q_{i+v}\to p_{i+1}\\s+t-r:p_i\to q_{i+v+1}\end{cases}\),且根据 \(w\) 的四边形不等式可知,交换后得到的边权和肯定更小。
-
引理 4.4:\(f(k)\) 关于 \(k\) 是下凸的,即对于任意 \(1<k<n-1\) 有 \(f(k)-f(k-1)\leq f(k+1)-f(k)\)。
证明:引理 4.3 的直接推论。
得到了引理 4.4 后,我们就可以考虑使用 wqs 二分。假设二分后的斜率为 \(x\),那么转化后的问题为:
\[f_{j}=\min_{1\leq k<j}f_{k}+w_{k,j}-x \]显然 \(\{w_{k,j}-x\}_{j,k}\) 也满足四边形不等式,所以原问题可以利用 Wilber 算法做到 \(O(n\log V)\),其中 \(V\) 为答案上界。
-
注 4.5:当我们需要对单个 \(k\) 构造方案时,假设 \(f(k)-f(k-1)=f(k+1)-f(k)\),那么怎么切都不可能单独切到 \(k\),此时需要用引理 4.3 的构造方法:
假设答案斜率是 \(x\),用 \(x-\varepsilon\) 切到的是 \((p,f(p))\),用 \(x+\varepsilon\) 切到的是 \((q,f(q))\),那么 \(p\leq k\leq q\) 且对于任意 \(p< i<q\) 有 \(f(i)-f(i-1)=f(i+1)-f(i)\)。此时我们知道 \(p,q\) 的构造方案,那么用引理 4.3 中的构造方法构造出 \(k\) 和 \(p+q-k\) 的方案,发现此时构造出的方案的值 \(f(k)',f(p+q-k)'\) 一定是最优的:
- 一方面,根据引理 4.3 可知构造出来的方案满足 \(f(k)'+f(p+q-k)'\leq f(p)+f(q)=2f(p)+(q-p)x\)。
- 另一方面,应当有 \(f(k)'\geq f(k)=f(p)+(k-p)x\) 和 \(f(p+q-k)'\geq f(p+q-k)=f(p)+(q-k)x\)。
综合两方面可知 \(f(k)'=f(k)\) 且 \(f(p+q-k)'=f(p+q-k)\)。
路径单调性和不交性
利用路径单调性和不交性,可以用另一种常数较小的方法在同样 \(O(nk)\) 的时间复杂度内解决原问题。
设 \(x_1,\cdots,x_{k+1}\) 是 \(1\) 到 \(n\) 的长度为 \(k\) 的字典序最小的最短路,那么定义 \(f_{k,n}\) 的最优转移点为 \(K_{k,n}=x_k\)。
-
引理 4.6:设 \(x_1,\cdots,x_{k+1}\) 是 \(p_1\) 到 \(q_1\) 的长度为 \(k\) 的字典序最小的最短路,\(y_1,\cdots,y_{k+1}\) 是 \(p_2\) 到 \(q_2\) 的长度为 \(k\) 的字典序最小的最短路,且 \(p_1\leq p_2\),\(q_1\leq q_2\)。则对于任意 \(1\leq i\leq k+1\),\(x_i\leq y_i\)。
证明:假设不满足。考虑第一个 \(x_i>y_i\) 的位置,必然满足 \(x_{i-1}\leq y_{i-1}<y_i<x_i\)。
再找到之后第一个 \(x_j\leq y_j\) 的位置,必然满足 \(y_{j-1}<x_{j-1}<x_j\leq y_j\)。
此时将两部分的端点均交换,仍然得到 \(p_1\) 到 \(q_1\) 和 \(p_2\) 到 \(q_2\) 的路径各一条(\(x_1,\cdots,x_{i-1},y_i,\cdots,y_{j-1},x_j,\cdots,x_{k+1}\) 和 \(y_1,\cdots,y_{i-1},x_i,\cdots,x_{j-1},y_j,\cdots,y_{k+1}\)),且根据四边形不等式这两条路径的权值和不会变大,于是它们仍然是各自的最优路径,而从 \(p_1\) 到 \(q_1\) 的路径的字典序变小了,矛盾。
-
引理 4.7:对于任意 \(k,n\),有 \(K_{k,n-1}\leq K_{k,n}\)。
-
引理 4.8:设 \(x_1,\cdots,x_{k+1}\) 是从 \(1\) 到 \(n\) 的长度为 \(k\) 的字典序最小的最短路。则对于任意 \(1\leq l\leq r\leq k+1\),\(x_l,\cdots,x_r\) 是从 \(x_l\) 到 \(x_r\) 的长度为 \(r-l\) 的字典序最小的最短路。
-
引理 4.9:设 \(x_1,\cdots,x_{k+1}\) 是 \(1\) 到 \(n\) 的长度为 \(k\) 的字典序最小的最短路,\(y_1,\cdots,y_{k+2}\) 是 \(1\) 到 \(n\) 的长度为 \(k+1\) 的字典序最小的最短路。则对于任意 \(1<i<k+2\),\(x_{i-1}\leq y_i\leq x_i\)。
证明:注意到 \(y_1,\cdots,y_{k+1}\) 是 \(1\) 到 \(y_{k+1}\) 的长度为 \(k\) 的字典序最小的最短路,且 \(x_1=y_1\)、\(y_{k+1}\leq x_{k+1}\),那么根据引理 4.6 可知对于任意 \(1\leq i\leq k+1\) 有 \(y_i\leq x_i\);
而 \(y_2,\cdots,y_{k+1}\) 是 \(y_2\) 到 \(n\) 的长度为 \(k\) 的字典序最小的最短路,且 \(x_1\leq y_2\)、\(x_{k+1}=y_{k+1}\),那么根据引理 4.6 可知对于任意 \(2\leq i\leq k+1\) 有 \(x_{i-1}\leq y_i\)。
-
引理 4.10:对于任意 \(k,n\),有 \(K_{k,n}\leq K_{k+1,n}\)。
引理 4.7 和引理 4.10 实际上描述了决策单调性最短路问题的二维单调性,那么我们也能类似地使用最优搜索树中的方法按 \(n-k\) 从小往大依次求出所有 \(f_{k,n}\)。这样即使不使用 SMAWK 算法,也能在 \(O(nk)\) 的复杂度内解决决策单调性最短路问题。
环上邮局
原问题在环上的一个扩展例题。
XIX Open Cup Grand Prix of Zhejiang I. 环上邮局
在一个长度为 \(L\) 的环上给定 \(n\) 个点,你需要将环恰好分为 \(k\) 段,每段的代价为该段中所有点到这些点中位数的距离和,要求最小化所有段的代价和。
先考虑枚举一个断点,然后断环为链。设 \(x_i\) 表示第 \(i\) 个点的坐标,\(w_{i,j}\) 表示将 \((i,j]\) 分为一段的代价。
-
引理 4.11:\(w\) 满足四边形不等式。
证明:根据引理 1.5,只需对 \(i<j\) 证明 \(w_{i,j}+w_{i+1,j+1}\leq w_{i,j+1}+w_{i+1,j}\) 即可。
设 \(P_{i,j}\) 表示 \([i,j]\) 的中位数(如果 \(j-i\) 是奇数的话 \(P_{i,j}\) 在一段范围内任意可选),显然存在一种方式使得 \(P_{i,j}=P_{i,j+1}\) 且 \(P_{i+1,j+1}=P_{i+1,j}\)。
那么原式两侧抵消后剩下 \(|x_{j+1}-P_{i+1,j+1}|\leq |x_{j+1}-P_{i,j}|\),这无论 \(P_{i,j},P_{i+1,j+1}\) 怎么取都是成立的。
于是现在问题就变成了决策单调性最短路问题,要求的是 \(f_{n,k}\),利用凸性可以做到总复杂度 \(O(n^2\log V)\)。
考虑进一步分析,设 \(0\) 到 \(n\) 的长度为 \(k\) 的字典序最小的最短路为 \(x_1,\cdots,x_{k+1}\)。全局长度为 \(k\) 的字典序最小的最短路为 \(y_1,\cdots,y_{k+1}\),那么 \(y_k<n\leq y_{k+1}=y_1+n\)(这里默认断环为链时将链复制了无限次)。
-
引理 4.12:对于任意 \(1\leq i\leq k+1\) 有 \(x_i\leq y_i\)。
证明:将路径 \(x_1,\cdots,x_{k+1}\) 和 \(y_1,\cdots,y_{k+1}\) 比较,它们都是字典序最小的,利用引理 4.6 即可。
-
引理 4.13:对于任意 \(1\leq i<k+1\) 有 \(y_i\leq x_{i+1}\)。
证明:假设不满足,考虑将路径 \(x_2,\cdots,x_{k+2}\) 和 \(y_1,\cdots,y_{k+1}\) 比较。注意我们的假设不能说明 \(x_2,\cdots,x_{k+2}\) 是字典序最小的,所以不能直接用引理 4.5。但是 \(x_2,\cdots,x_{k+2}\) 仍然是 \(x_2\) 到 \(x_{k+2}\) 的最短路。
找到最小的 \(i\geq 1\) 使得 \(y_i>x_{i+1}\),那么必然有 \(y_{i-1}\leq x_i<x_{i+1}<y_i\)。
再找到最小的 \(j> i\) 使得 \(y_j\leq x_{j+1}\) 重新满足(注意 \(y_k<n=x_{k+1}\) 所以 \(j\) 存在且 \(j\leq k\)),那么必然有 \(x_{j}<y_{j-1}<y_j\leq x_{j+1}\)。
此时将两部分分别端点交换,即可得到两条新的路径。
- 若 \(i>1\),则得到的为 \(y_1,\cdots,y_{i-1},x_{i+1},\cdots,x_j,y_j,\cdots,y_{k+1}\) 和 \(x_2,\cdots,x_i,y_i,\cdots,y_{j-1},x_{j+1},\cdots,x_{k+2}\),仍然是 \(y_1\) 到 \(y_{k+1}\) 和 \(x_2\) 到 \(x_{k+2}\) 的路径,且由四边形不等式可知二者的长度和没有变大,所以二者仍然是各自的最短路。而显然 \(y_1\) 到 \(y_{k+1}\) 的路径的字典序变小了,矛盾。
- 若 \(i=1\),则可以看成将 \(i=k+1\) 的部分也交换了,得到的为 \(y_1,\cdots,y_{j-1},x_{j+1},\cdots,x_{k+1},y_{k+1}\) 和 \(x_2,\cdots,x_j,y_j,\cdots,y_{k},x_{k+2}\)。同样地二者仍然是各自的最短路,而 \(y_1\) 到 \(y_{k+1}\) 的路径经过了 \(x_{k+1}\),这意味着这条路径可以调整为从 \(x_1=0\) 开始而字典序更小,矛盾。
引理 4.12 和引理 4.13 表明,存在最优解使得每段 \([x_i,x_{i+1}]\) 内恰好经过一个节点。那么考虑取其中最短的一段枚举每个点断环为链计算答案,这样枚举量降为 \(O(\frac nk)\),每次进行 \(O(nk)\) 的动态规划,即可得到 \(O(n^2)\) 的做法。
- 引理 4.14:设 \(y_1,z_1\) 使得 \(x_1\leq y_1\leq z_1\leq x_2\)。设 \(y_1,\cdots,y_{k+1}\) 是 \(y_1\) 到 \(y_1+n\) 的字典序最小的最短路,\(z_1,\cdots,z_{k+1}\) 是 \(z_1\) 到 \(z_1+n\) 的字典序最小的最短路。则对于任意 \(1\leq i\leq k+1\),\(y_i\leq z_i\)。
考虑利用引理 4.14 分治,使得对于每个 \(y_1\in [x_1,x_2]\) 求出 \(y_1\) 到 \(y_1+n\) 的最优解及方案。具体地,我们维护 \([l_1,r_1]\subseteq [x_1,x_2],\cdots,[l_k,r_k]\subseteq [x_k,y_k]\),表示我们要求 \(y_1\in [l_1,r_1]\) 的最优解及方案,且已知 \(y_i\in [l_i,r_i]\)。每次取 \([l_1,r_1]\) 中点作为 \(y_1\),然后做 \(k-1\) 次 SMAWK 依次求出对应的 \(y_2,\cdots,y_k\),然后递归到两边的问题进行处理。
做 \(k-1\) 次 SMAWK 的时间复杂度为 \(O(\sum r_i-l_i)\),所以看起来时间复杂度是 \(O(n\log n)\) 的。但实际上,由于分治时 \(y_i\) 既被分到了 \([l_i,r_i]\) 的左半、又被分到了右半,所以分治树上同一层中所有节点 \(u\) 的 \(\sum r_i-l_i+1\) 之和应当是:
\[\sum_u\sum_i(r_i-l_i+1)=\sum_u\left(\sum_i(r_i-l_i)+k\right)=O(n)+\text{该层的节点数}\cdot k \]而分治树的节点个数就是 \(x_2-x_1+1=O(n)\),于是总复杂度应当为 \(O(n\log n+nk)\)。
优化也和前面一样,取 \(x_{i+1}-x_i+1\) 最小的一段进行上述算法,此时 \(x_{i+1}-x_i+1\) 是 \(O(\frac nk)\) 的,时间复杂度降为 \(O(n\log n)\)。
最后总复杂度是 \(O(n(\log n+\log V))\)。
五、四边形不等式的其他应用
蒙日矩阵的生成
列举了常见的蒙日矩阵。
- 引理 5.1:设 \(C,D\) 是蒙日矩阵,\(\lambda\geq 0\)。那么 \(C+D\),\(\lambda C\),\(C^{\mathsf T}\) 都是蒙日矩阵。
根据引理 5.1,我们可以使用简单蒙日矩阵进行线性组合得到随机性较强的蒙日矩阵。
-
引理 5.2:设 \(A\) 是 \(n\times m\) 的矩阵。那么当 \(A\) 满足下面条件之一时,\(A\) 是蒙日矩阵:
- \(A_{x,y}=\min(x,y)\)。
- \(A_{x,y}=\max(x,y)\)。
- \(A_{x,y}=xy\)。
- \(A_{x,y}=|x-y|^p\),\(p\geq 1\)。
- \(A\) 是另一非负矩阵 \(B\) 的二维前缀和。
- \(A_{x,y}=v_x\)。
- \(A_{x,y}=f(x-y)\),其中 \(f\) 是下凸函数。
-
例 5.3:设 \(S\) 是有限集。设函数 \(f\) 使得对于任意 \(X\subseteq 2^S\) 有 \(f(X):=|\bigcup_{T\in X}T|\)。
那么对于任意 \(X,Y\subseteq 2^{S}\),有 \(f(X)+f(Y)\geq f(X\cap Y)+f(X\cup Y)\)。证明:
\[ \begin{aligned} \left|\bigcup_{T\in X}T\right|+\left|\bigcup_{T\in Y}T\right|&=\left|\left(\bigcup_{T\in X}T\right)\cup\left(\bigcup_{T\in Y}T\right)\right|+\left|\left(\bigcup_{T\in X}T\right)\cap\left(\bigcup_{T\in Y}T\right)\right|\\ &=\left|\bigcup_{T\in X\cup Y}T\right|+\left|\left(\bigcup_{T\in X}T\right)\cap\left(\bigcup_{T\in Y}T\right)\right|\\ &\geq \left|\bigcup_{T\in X\cup Y}T\right|+\left|\bigcup_{T\in X\cap Y}T\right|\\ \end{aligned} \]从而,任取 \(2^S\) 中的 \(n\) 个元素,并将它们排成一列 \(T_1,\cdots,T_n\)。记 \(w_{i,j}=f(\{T_i,\cdots,T_j\})\),\(-w\) 应当满足四边形不等式(此时应用到 \(\max\) 型问题)。
这类满足对于任意 \(X,Y\subseteq E\) 有 \(f(X)+f(Y)\geq f(X\cap Y)+f(X\cup Y)\) 的函数 \(f\) 被称为次模函数。