首页 > 其他分享 >计算理论导论笔记

计算理论导论笔记

时间:2024-05-04 23:34:08浏览次数:24  
标签:语言 导论 笔记 图灵机 计算 NP alpha Sigma mathrm

计算理论导论笔记

正则语言和自动机(Regular Languages and Automata)

DFA

确定性有限状态自动机(Deterministic Finite state Automata/DFA)由一个五元组 \((Q,\Sigma,\delta,q_0,F)\) 唯一确定。

  • \(Q\) 为状态集合。
  • \(\Sigma\) 为字符集。
  • \(\delta:Q\times\Sigma\to Q\) 为状态转移函数。
  • \(q_0\) 初始状态。
  • \(F\sube Q\) 为可接受状态集(accept states)。

令 \(A\) 为机器 \(M\) 接受的所有串的集合,称 \(A\) 是机器 \(M\) 的语言(Language),或者称 \(M\) 接受/承认 \(A\),记作 \(\mathrm{L}(M)=A\)。

正则语言

对于某个语言,如果存在某个机器承认它,那么我们称其为正则语言(Regular Language)。

可以证明,所有正则语言的集合关于交集、并集、补集、笛卡尔积、级联(Concatenation)运算、闭包(star)操作封闭。

级联:\(A\circ B=\{ab|a\in A,b\in B\}\)。

闭包操作:\(A^{*}=\{x_1x_2\cdots x_k|k\ge 0,x_i\in A\}\)。

NFA

非确定性有限状态自动机(Non-deterministic Finite state Automata/NFA)也可以由一个五元组 \((Q,\Sigma,\delta,q_0,F)\) 唯一确定。

  • \(Q\) 为状态集合。
  • \(\Sigma\) 为字符集。(记 \(\Sigma_{\epsilon}=\Sigma\cup \{\epsilon\}\))
  • \(\delta:Q\times\Sigma_{\epsilon}\to \mathcal{P}(Q)\) 为状态转移函数,其中 \(\mathcal{P}(\cdot)\) 为幂集。
  • \(q_0\) 初始状态。
  • \(F\sube Q\) 为可接受状态集(accept states)。

\(N=(Q,\Sigma,\delta,q_0,F)\),则串 \(w=w_1w_2\cdots w_n(w_i\in \Sigma)\) 被 \(N\) 接受当其可以被视作 \(w_1w_2\cdots w_m((w_i\in \Sigma_{\epsilon}))\) \(Q\) 中存在状态序列 \(r_0,r_1,\dots,r_m\) 满足 \(r_0=q_0\),\(r_{i+1}\in \delta(r_i,w_{i+1}),\forall 0\le i\le n-1\),\(r_m\in F\)。这里的 \(\epsilon\) 为空字符。NFA 同样也有其对应的语言。

显然 NFA 是 DFA 的扩展。同时可以证明对于每个 NFA \((Q,\Sigma,\delta,q_0,F)\),存在和其识别语言相同的 DFA \((Q',\Sigma',\delta',q_0',F')\)。

先不考虑 \(\epsilon -\) 边,考虑到每一个字符前缀在 NFA 上对应的可能能跳到的节点都是 \(Q\) 的一个子集,于是我们直接令 \(Q'=\mathcal{P}(Q)\),然后 \(\forall S\in Q',a\in \Sigma\),令 \(\delta'(S,a)=\bigcup_{s\in S}\delta(s,a)\),接着取 \(q_0'=\{q_0\}\),最后令 \(F'=\{S\in Q'|\exist s\in S,s\in F\}\)。

如果加上 \(\epsilon -\) 边差不多,取 \(E(S)\) 为 \(S\) 可以通过 \(0\) 或更多 \(\epsilon -\) 边到达的状态集,取 \(\delta'(S,a)=\bigcup_{s\in S}E(\delta(s,a))\),\(q_0'=E(\{q_0\})\) 即可。

正则表达式

\(R\) 是正则表达式(Regular Expressions)如果 \(R\) 是(下面 \(R_1,R_2\) 是一些正则表达式):

  1. 一个字符 \(a(a\in \Sigma)\) 的集合
  2. 长度为 \(0\) 的字符 \(\epsilon\)
  3. \(\varnothing\)
  4. \(R_1\cup R_2\)
  5. \(R_1\circ R_2\)
  6. \(R_1^{*}\)

定理:一个语言正则当且仅当存在正则表达式描述它。

则表达式描述的一定是正则语言:按照正则语言的定义构造 DFA 即可。

正则语言一定可以用正则表达式描述,这个证明有点复杂。

首先我们引入推广性确定性有限自动机(GNFA),区别在于每条边上除了可能是空字符 \(\epsilon\)、字符集中字符,还有可能是一个正则表达式。然后整个构造方法大概就是由 NFA 不断缩小,最后只剩下两个状态为止,此时即找到该正则语言对应的正则表达式。

对于一个 DFA,我们先通过一些简单的处理让其变成 NFA,同时只有一个初始节点与接受节点,且初始节点没有入边,接受节点没有出边。删减过程就是每次选择一个非初始节点并且非接受节点的节点 \(x\),然后对于每对节点 \(s,t\),更新 \(s\to t\) 的边为 \((s\to t)\cup(s\to x)\circ(x\to x)^{*}\circ(x\to t)\),接着删掉 \(x\)。重复该过程直到只剩下初始节点与接受节点,此时它们之间的边即为正则语言对应的正则表达式。

非正则语言

泵引理(Pumping Lemma):如果 \(A\) 是正则语言,那么存在 \(p\) 满足,对于任意长度大于等于 \(p\) 的 \(A\) 中字符串 \(s\),\(s\) 总能切成三部分 \(s=xyz\) 满足 \(\forall i\ge 0,xy^iz\in A,|y|>0,|xy|\le p\)。(直观来说就是存在循环节,这个比较好证,由状态有限,直接取 \(p=|Q|\) 即可,总有一个状态被经过了至少两次)

上下文无关语言和下推自动机(Context Free Languages and Pushdown Automata)

上下文无关语言(CFL)

上下文无关语法是一个四元组 \((V,\Sigma,R,S)\),其中:

  1. \(V\) 是一个叫做变量(variables)的有限集合。
  2. \(\Sigma\) 是一个和 \(V\) 不相交的有限集合,叫做终结符(terminals)集合。
  3. \(R\) 是一个规则(rules)的有限集,每条规则把一个变量映射成一个变量和终结符的字符串。
  4. \(S\in V\) 是开始变量。

令 \(u,v,w\) 是变量和终止符组成的字符串,如果 \(A\to w\) 是该语法的一条规则,那么我们称 \(uAv\) 可以产生(yields)\(uwv\),记作 \(uAv\Rightarrow uwv\)。称 \(u\) 可以产生(derives)\(v\),同样记作 \(u\Rightarrow v\),当 \(u=v\) 或者存在序列 \(u_1,u_2,\dots,u_k(k\ge 0)\) 满足 \(u\Rightarrow u_1\Rightarrow u_2\Rightarrow \cdots \Rightarrow v\)。

那么所有可以由 \(S\) 产生的字符串集合称作该语法的语言。

下推自动机(PDA)

下推自动机由六元组 \((Q,\Sigma,\Gamma,\delta,q_0,F)\) 组成,其中:

  1. \(Q\) 状态集。
  2. \(\Sigma\) 输入字符集。
  3. \(\Gamma\) 堆栈字符集。
  4. \(\delta:Q\times \Sigma_{\epsilon}\times \Gamma_{\epsilon}\to \mathcal{P}(Q\times \Gamma_{\epsilon})\) 转移函数。
  5. \(q_0\in Q\) 起始状态。
  6. \(F\sube Q\) 接受状态集。

一个字符串 \(w\) 可以被下推自动机 \(M=(Q,\Sigma,\Gamma,\delta,q_0,F)\) 接受当 \(w\) 可以被视作 \(w_1,w_2,\dots,w_m(w_i\in \Sigma_{\epsilon})\),并且存在状态序列 \(s_0,s_1,s_2,\dots,s_m\) 和字符串 \(t_1,t_2,\dots,t_m\) 满足:

  1. \(s_0=q_0\) 并且 \(t_0=\epsilon\)。
  2. 对于 \(i=0,1,\dots,m-1\),满足 \((s_{i+1},b)\in \delta(s_i,w_{i+1},a)\),其中 \(t_i=ar,t_{i+1}=br\) 并且 \(a,b\in \Gamma_{\epsilon},r\in \Gamma^*\)。
  3. \(s_m\in F\)。

两者关系

上下文无关语言和下推自动机的计算能力是一样的。

从语言到自动机:一个很简单的想法就是考虑展开规则是有限的,所以直接用堆栈描述当前历史所有在展开哪个规则以及展开到哪一步即可。

从自动机到语言:

我们可以很简单地修改 PDA 使得接受状态只有一个,且最后栈弹空,且栈只存在加入和删除,不存在替换。

\(P=(Q,\Sigma,\Gamma,\delta,q,\{q_a\}),G=(V,\Sigma,R,S)\),取 \(V=\{A_{p,q}|p,q\in Q\}\),取三条规则。

  1. \(\forall p,q,r,s\in Q,u\in \Gamma,a,b\in \Sigma_{\epsilon}\),若 \(\delta(p,a,\epsilon)\ni (r,u),\delta(s,b,u)\ni (q,\epsilon)\),加入规则 \(A_{p,q}\Rightarrow aA_{r,s}b\)。
  2. \(\forall p,q,r\in Q\),加入规则 \(A_{p,q}\Rightarrow A_{p,r}A_{r,q}\)。
  3. \(\forall p\in Q\),加入规则 \(A_{p,p}\Rightarrow \epsilon\)。

取 \(S=A_{q,q_a}\)。

CFL 的边界

Pumping Lemma for CFLs:如果 \(A\) 是 CFL,那么存在 \(p\) 满足如果 \(s\in A\) 且 \(|s|\ge p\),那么 \(s\) 可以被切分为五个部分 \(uvxyz\) 满足 \(\forall i\ge 0,uv^ixy^iz\in A\) 且 \(|vy|>0,|vxy|\le p\)。

怎么证明:考虑 CFL 按照语法构造过程中形成的树结构,树只要足够大必然存在两个相同的变量出现在一条直上直下的路径上,那么用上面的变量树替换下面的变量树即可造成重复。

举例:\(\{a^nb^nc^n|n\in \mathbb{N}\},\{ww|w\in \{0,1\}^*\}\) 不是上下文无关模型。

图灵机

图灵机(Turing Machine/TM)

\(k\) 纸带图灵机是一个七元组 \((Q,\Sigma,\Gamma,\delta,q_0,q_{accept},q_{reject})\):

  1. \(Q\) 状态集,\(\Sigma\) 输入字符集,\(\Gamma\) 纸带字符集。
  2. \(\delta:Q\times \Gamma^k\to Q\times \Gamma^k\times \{L,S,R\}^k\)。
  3. \(q_0\) 开始状态,\(q_{accept}\) 接受状态,\(Q_{reject}\) 拒绝状态。

可以看成是一个布尔函数。

当前状态 \(q;x=(x_1,\dots,x_k)\),一次转移步骤 \(\delta(q,x)=(q',x',z),z\in \{L,S,R\}^k\)。

一个格局(configuration):当前状态,纸带内容,当前纸带头位置。

进入 \(q_{accept},q_{reject}\) 停机。

可识别 可判定

如果一个语言可以被图灵机 \(M\) 识别,就称其是可识别的(recognizable),然而还是有可能存在输入使得 \(M\) 无法停机。

如果一个图灵机 \(M\) 从来不会死循环就称其可以判定一个语言,继而有可判定的(decidable)定义。

对于一个函数 \(f:\{0,1\}^*\to \{0,1\}^*\),称 \(M\) 计算 \(f\) 如果对于任意输入 \(x\),\(M\) 都会进入停机状态且在输出纸带上面写了 \(f(x)\)。

称图灵机 \(M\) 运行时间为 \(T(n)\) 当对任意输入 \(x\),图灵机运行不超过 \(T(|x|)\) 步就会停机。

\(T:\mathbb{N}\to \mathbb{N}\) 是时间可构造(time-constructible)当 \(T(n)\ge n\) 且存在一个图灵机在时间 \(T(n)\) 内计算 \(x\rightarrow T(|x|)\)。

大字符集

对于任意图灵机 \(M\) 在时间 \(T(n)\) 内计算函数 \(f\),使用纸带字符集 \(\Gamma\),那么存在另一个图灵机 \(M'\) 在时间 \(O(T(n)\log |\Gamma|)\) 内计算函数 \(f\) 而只用纸带字符集 \(\{0,1,\triangle,\underline{ }\}\)。

把大字符集编码即可。

多条纸带

对于任意 \(k\) 条纸带图灵机 \(M\) 在时间 \(T(n)\) 内计算函数 \(f\),那么存在另一个只用一条纸带的图灵机 \(M'\) 在时间 \(O(kT^2(n))\) 内计算函数 \(f\)。

Church-Turing Thesis

任何算法等价于一个图灵计算过程。

通用图灵机(Universal TM)

存在一个通用图灵机可以模拟任何图灵机运行。

存在一个图灵机满足 \(\forall x.\alpha\in \{0,1\}^*,U(x,\alpha)=M_{\alpha}(x)\),其中 \(\alpha\) 代表了图灵机 \(M_{\alpha}\),如果对于某个输入 \(x\),\(M_{\alpha}\) 运行了 \(T\) 步停机,那么 \(U(x,\alpha)\) 运行了 \(CT\log T\) 步停机,其中 \(C\) 是取决于 \(M_{\alpha}\) 的一个常数。

图灵机的能力

存在不能被任何图灵机计算的布尔函数吗?

存在不能被任何图灵机识别/判定的语言吗?

存在能被图灵机识别但是不能被判定的语言吗?

可计算性

\(\mathrm{UC}\)

定义一个布尔函数 \(\mathrm{UC}:\{0,1\}^*\to \{0,1\}\),对于任意输入 \(\alpha\),设 \(\alpha\) 表示的图灵机为 \(M_{\alpha}\),那么如果 \(M_{\alpha}(\alpha)=1\) 表示 \(M_{\alpha}\) 接受字符串 \(\alpha\),那么我们取 \(\mathrm{UC}(\alpha)=0\)(拒绝),否则我们取 \(\mathrm{UC}(\alpha)=1\)(接受)。

那么 \(\mathrm{UC}\) 就是不可计算,其对应的语言就是不可判定的。

证明:假设存在图灵机 \(M\) 计算 \(\mathrm{UC}\),令 \(<M>\) 为 \(M\) 的字符串表示,那么有 \(\mathrm{UC}(<M>)=M(<M>)\) 而 \(\mathrm{UC}(<M>)\ne M(<M>)\) 矛盾。

\(\mathrm{HALT}\)

考虑语言 \(\mathrm{HALT}=\{<M,\alpha>|M\text{ halts on }\alpha\}\),那么该语言是不可判定的。(PS:该语言是可识别的,考虑直接模拟将 \(\alpha\) 输入 \(M\)。)

考虑反证法,假设存在这样一个判定该语言的图灵机 \(M_{\mathrm{HALT}}\),那么对于任意字符串 \(\alpha\) 定义的图灵机 \(M_{\alpha}\),考虑用 \(<M_{\alpha},\alpha>\) 输入 \(M_{\mathrm{HALT}}\),如果被接受了,说明不会死循环,然后直接模拟可以得出 \(M_{\alpha}(\alpha)\) 取反,否则输出 \(1\),由此我们通过该图灵机构造出了一个计算 \(\mathrm{UC}\) 的图灵机,矛盾。

\(A_{\mathrm{TM}}\)

考虑语言 \(A_{\mathrm{TM}}=\{<M,\alpha>|M\text{ accepts }\alpha\}\),那么该语言不可判定。

同样用判定语言 \(A_{\mathrm{TM}}\) 的图灵机 \(M_A\) 构造 \(M_{\mathrm{UC}}\),对于输入 \(\alpha\) 取 \(M_A(\alpha,\alpha)\) 即可。

映射归约

对于两个问题 \(A,B\),我们将 \(A\) 规约成 \(B\) 来解决 \(A\),可以先解决 \(B\) 然后用这个解决方法解决 \(A\)。

我们称一个语言 \(A\) 可以被映射归约(mapping reducible)到语言 \(B\),记作 \(A\le_m B\),如果存在一个可计算的函数 \(f:\Sigma^*\to \Sigma^*\) 满足 \(\forall w,w\in A\) 当且仅当 \(f(w)\in B\)。

如果 \(A\le_m B\),那么:\(B\) 可判定 \(\Rightarrow\) \(A\) 可判定,\(A\) 不可判定 \(\Rightarrow\) \(B\) 不可判定。

\(E_{\mathrm{TM}}\)

考虑语言 \(E_{\mathrm{TM}}=\{<M>|M \text{ accepts nothing}\}\),那么该语言不可判定。

考虑证明 \(A_{\mathrm{TM}}\le_m E_{\mathrm{TM}}\) 或者 \(A_{\mathrm{TM}}\le_m \overline{E_{\mathrm{TM}}}\)。

\(EQ_{\mathrm{TM}}\)

考虑语言 \(EQ_{\mathrm{TM}}=\{<M_1,M_2>|M_1 \text{ and }M_2 \text{ are TMs and } L(M_1)=L(M_2)\}\),那么该语言不可判定。

考虑证明 \(E_{\mathrm{TM}}\le_m EQ_{\mathrm{TM}}\)。

回顾

\(A\) 可识别不等价于 \(\overline{A}\) 可识别。

\(A\) 可判定等价于 \(\overline{A}\) 可判定。

定理:\(A\) 可判定等价于 \(A\) 可识别且 \(\overline{A}\) 可识别。

时间复杂性(Time Complexity)

复杂性类

复杂性类:可以由一定量的计算资源计算的问题(语言)构成的集合。

定义时间函数 \(T:N\to N\) 任意函数,定义 \(\mathrm{DTIME}(T(n))\) 为可以被某些图灵机在 \(O(T(n))\) 时间内解决的问题(判定的语言集合)。

多项式时间复杂性类 \(\mathrm{P}=\cup_{c\ge 0}\mathrm{DTIME}(n^c)\)。

考虑两个时间可构造函数 \(f,g\),若 \(f(n)=o(g(n))\),则显然 \(\mathrm{DTIME}(f(n))\sube \mathrm{DTIME}(g(n))\)。能否构造语言 \(A\) 使得 \(A\in \mathrm{DTIME}(g(n))\) 而 \(A\notin \mathrm{DTIME}(f(n))\)?

考虑构造图灵机 \(M\):对于任意输入 \(x\),取 \(x\) 对应的图灵机 \(M_x\),在 \(O(g(n))\) 时间内模拟 \(M_x(x)\),如果结果是 \(1\) 输出 \(0\),否则输出 \(1\)。那么显然 \(\mathrm{L}(M)\in \mathrm{DTIME}(g(n))\)。如果 \(\mathrm{L}(M)\in \mathrm{DTIME}(f(n))\),那么存在图灵机 \(M'\) 在时间 \(O(f(n))\) 内判定 \(\mathrm{L}(M)\),\(M'\) 的字符串表示为 \(<M'>\) 则有 \(M'(<M'>)=M(<M'>)\) 矛盾。

多项式时间可验证复杂性类 \(\mathrm{NP}\),一个语言 \(L\) 属于 \(\mathrm{NP}\) 当存在多项式函数 \(P:N\to N\) 和一个多项式时间图灵机 \(M\) 满足对于任意 \(x\in \{0,1\}^*\),\(x\in L\) 当且仅当 \(\exist u\in \{0,1\}^{P(|x|)}\) 满足 \(M(x,u)=1\)。此时也称 \(M\) 是 \(L\) 的验证机(verifier),\(u\) 被称作 \(x\) 的验证(certificate)。

定义 \(\mathrm{EXP}=\cup_{c\ge 0}\mathrm{DTIME}(2^{n^c})\),则有 \(\mathrm{P}\sube \mathrm{NP}\sube \mathrm{EXP}\)。已经有证明 \(\mathrm{P}\subsetneq \mathrm{EXP}\)。

非确定性图灵机

\(\mathrm{NP}\) 的最初定义是由非确定性图灵机(non-deterministic Turing machine/NDTM)引入的,NDTM 和 TM 的区别在于对于每个格局有多种可能的转移,只要存在一个分支接受一个输入即认为接受,只有所有分支都不接受即认为不接受。

同样类似地,我们可以定义在所有可能输入的所有分支都会停机的 NDTM 为判定机(decider),对于一个函数 \(T:N\to N\),称一个 NDTM 运行时间为 \(T(n)\) 如果对于任意长度为 \(n\) 的输入,其所有分支都在 \(T(n)\) 步骤内停机。

同样地,对于 \(T:N\to N\),\(\mathrm{NTIME}(T(n))\) 为可以被某些非确定性图灵机在 \(O(T(n))\) 时间内解决的问题(判定的语言集合)。则有 \(\mathrm{NP}=\cup_{c\ge 0}\mathrm{NTIME}(n^c)\)。

两种 \(\mathrm{NP}\) 的定义等价直接考虑验证 \(u\) 与不确定性的关系即可。

多项式时间规约

两者关系只需要考虑 \(\mathrm{NP}\) 中最难的那一类问题,使用归约的思想来定义难度。不过这里考虑的是时间复杂性,所以我们需要对归约过程做一点修改,就是在研究两种复杂性类的时候,归约过程不应该比其中更容易的复杂性类更复杂。在比较 \(\mathrm{P}\) 和 \(\mathrm{NP}\) 过程中,规约过程应该只考虑多项式时间归约(Polynomial Time Reduction)。

多项式时间归约:称 \(A\) 可以多项式时间归约到 \(B\),写作 \(A\le_p B\) 当存在一个多项式时间可计算函数 \(f:\Sigma^*\to \Sigma^*\) 满足 \(\forall w,w\in A\Leftrightarrow f(w)\in B\)。

\(\mathrm{NP-hard}\) 和 \(\mathrm{NP-complete}\)

语言 \(L\) 被称作是 \(\mathrm{NP-hard}\) 当且仅当 \(\forall A\in\mathrm{NP},A\le_pL\)。语言 \(L\) 被称作是 \(\mathrm{NP-complete}\) 当且仅当 \(L\) 是 \(\mathrm{NP-hard}\) 且 \(L\in NP\)。

由此我们可以得出,对于 \(\mathrm{NP-complete}\) 中的任意语言 \(L\),\(L\in P\) 等价于 \(\mathrm{P}=\mathrm{NP}\)。由此我们只需要研究 \(\mathrm{NP-complete}\) 的那些语言。

布尔表达式(Boolean formulas)与 \(\mathrm{3SAT}\)

变量 \(u_1,u_2,\dots,u_n\) 的布尔表达式 \(\varphi\) 由这些变量和三个逻辑运算符 \(\land,\lor,\lnot\) 组成,\(\lnot u\) 也可用 \(\overline{u}\) 表示。\(\varphi\) 也可以被视作一个布尔函数 \(\{0,1\}^n\to \{0,1\}\)。

文字(literal)是一个原子公式(的肯定)(positive)或一个原子公式的否定(negative),分别可以称作是文字和否文字。

析取(Disjunctive)类似或,析取子句(Disjunctive clause)是仅由或运算符/析取操作连接起来的文字组成的布尔表达式。

合取(Conjunctive)类似与,合取子句(Conjunctive clause)是仅由与运算符/合取操作连接起来的文字组成的布尔表达式。

\(\varphi\) 是合取范式(CNF/Conjunctive Normal Form)当它是由若干析取语句的合取操作组成,形如 \(\land_i(\lor_j v_{i,j})\)。同样有析取范式(DNF/Disjunctive Normal Form)由若干合取语句的析取操作组成。这两个都是命题公式(propositional formula)的标准形式。

\(k\)CNF 指每个语句只有 \(\le k\) 个文字。

Cook-Levin Theorem:定义语言 \(\mathrm{SAT}\) 由所有可满足的 CNF 语句组成;语言 \(\mathrm{3SAT}\) 由所有可满足的 \(3\)CNF 语句组成。则二者都是 \(\mathrm{NP-complete}\) 的。

\(\mathrm{SAT}\in\mathrm{NP}\):其验证即为一组合法的赋值。

\(\forall L\in \mathrm{NP},L\le_p\mathrm{SAT}\):考虑验证机 \(M\) 的计算过程,使用长度为多项式级别的 CNF 表达式描述。

\(\mathrm{SAT}\le_p\mathrm{3SAT}\) 知 \(\mathrm{3SAT}\in\mathrm{NP-complete}\)。

更多 \(\mathrm{NP}\) 相关例子

独立集(Independent Set)

\(\mathrm{INDSET}\) 判断图 \(G\) 是否有大小为 \(k\) 的独立集,则 \(\mathrm{INDEST}\in \mathrm{NP-complete}\)。

\(\mathrm{INDSET}\in \mathrm{NP}\):验证为点集。

\(\mathrm{3SAT}\le_p \mathrm{INDSET}\):考虑 \(\mathrm{3SAT}\) 中的每一个子句,共有 \(2^3-1\) 种合法的状态,而且只有其中一个状态能够存在,于是连一个大小为 \(7\) 的团,而对于团外的任意两个状态,如果其冲突则连一条边,然后看是否有子句数量那么多的独立集即可。

点覆盖(Vertex Cover)

\(\mathrm{Vertex-Cover}\) 判断图 \(G\) 是否有大小为 \(k\) 的点覆盖,则 \(\mathrm{Vertex-Cover}\in \mathrm{NP-complete}\)。

\(\mathrm{Vertex-Cover}\in \mathrm{NP}\):验证为点集。

\(\mathrm{INDSET}\le_p\mathrm{Vertex-Cover}\):有大小为 \(k\) 的点覆盖,取反得到大小为 \(n-k\) 的独立集。

0/1整数规划(0/1 Integer Programming)

\(\mathrm{IPROG}\) 给定 \(m\) 个有理数系数的线性约束,判断是否有合法的给每个变量赋 \(\{0,1\}\) 满足每个约束的方法,则 \(\mathrm{IPROG}\in \mathrm{NP-complete}\)。

\(\mathrm{IPROG}\in \mathrm{NP}\):验证为一种合法赋值。

\(\mathrm{SAT}\le_p\mathrm{IPROG}\):析取子句每个文字和大于等于 \(1\) 即可。

哈密顿路径(Hamiltonian Path)

\(\mathrm{dHAMPATH}\) 判断有向图是否有哈密顿路径,则 \(\mathrm{dHAMPATH}\in \mathrm{NP-complete}\)。

\(\mathrm{dHAMPATH}\in \mathrm{NP}\):验证是路径顺序。

\(\mathrm{SAT}\le_p\mathrm{dHAMPATH}\):对于任意的 \(n\) 个变量 \(m\) 个子句的 \(\mathrm{SAT}\),每个变量构造 \(2m+2\) 个点按顺序排列,相邻点连双向边,经过这些点时使用从左到右表示该变量取 \(1\),从右到左表示该变量取 \(0\)。然后额外有开始点和结束点,接着我们按任意顺序确定每个变量的取值,也即将前一个变量的两个端点都连到下一个变量的两个端点,开始点和结束点同样如此操作,接着对于每个限制构造一个点,如果限制 \(j\) 包含了 \(u_i\),那么将第 \(i\) 个变量的第 \(2j\) 个点连到限制 \(j\) 的点再连到第 \(i\) 个变量的第 \(2j+1\) 个点,而如果包含 \(\lnot u_i\) 则反着来。不妨认为这里的第 \(2j\) 个点和第 \(2j+1\) 个点互为匹配点。

首先如果存在合法赋值那么如此按照顺序走即可。

如果构造的图存在哈密顿回路,那么我们可以证明其必然是按照顺序走的,如果有通过限制构造的点跳跃的情况那么其匹配点只和一个额外点连接,就必须是结束点,矛盾,所以按照走的顺序依次给每个变量赋值即可。

同样有 \(\mathrm{dHAMCYCLE}\) 哈密顿环(Hamiltonoian Cycle),哈密顿路径很容易归约到哈密顿环(添加一个超级点连向所有点且被所有点连),所以也是 \(\mathrm{NP-complete}\)。

而无向图的情况容易变为有向图。

旅行商问题(TSP/Traveling Salesman)是否有长度小于等于 \(k\) 的经过所有点的方案,显然可以由哈密顿路径归约。

\(\mathrm{coNP}\)

语言 \(L\in \mathrm{coNP}\) 当 \(\lnot L\in \mathrm{NP}\),有 \(\mathrm{P}\sube \mathrm{NP}\cap \mathrm{coNP}\)。

另一种定义方式;语言 \(L\in \mathrm{coNP}\) 当存在多项式函数 \(P:N\to N\) 和多项式时间图灵机 \(M\) 满足对于任意 \(x\in \{0,1\}^*\),有 \(x\in L\) 当且仅当 \(\forall u\in \{0,1\}^{P(|x|)}\) 有 \(M(x,u)=0\)。

类似的,我们有 \(\mathrm{coNP-complete}\),且 \(\lnot \mathrm{SAT}\in\mathrm{coNP-complete}\)。

\(\mathrm{NEXP}\)

\(\mathrm{NEXP}=\cup_{c\ge 0}\mathrm{NTIME}(2^{n^c})\)。

有 \(\mathrm{P}\sube \mathrm{NP}\sube\mathrm{EXP}\sube \mathrm{NEXP}\)。

如果 \(\mathrm{P}=\mathrm{NP}\),我们可以推出 \(\mathrm{EXP}=\mathrm{NEXP}\)。

空间复杂性(Space Complexity)

类似时间复杂性,在图灵机中,使用过的工作纸带格子(work tapes,注意输入纸带格子不算在内)被称作使用过的空间。定义函数 \(S:N\to N\),如果图灵机 \(M\) 对于任意长度 \(n\) 的输入最多使用 \(S(n)\) 个工作纸带格子,那么我们可以称 \(M\) 运行空间消耗为 \(S(n)\)。

称语言 \(L\in\mathrm{SPACE(S(n))}\) 当存在图灵机 \(M\) 在空间 \(S(n)\) 判定 \(L\);类似的称 \(L\in\mathrm{NSPACE(S(n))}\) 当存在非确定性图灵机 \(M\) 在空间 \(S(n)\) 判定 \(L\)。特别的要求 \(S(n)\) 可以在 \(S(n)\) 空间内计算。

由于不考虑输入纸带格子,所以 \(S(n)<n\),然而一般要求 \(S(n)\ge \log n\) 因为要记录读到哪里了。

定理:$\mathrm{DTIME}(S(n))\sube \mathrm{SPACE}(S(n))\sube \mathrm{NSPACE}(S(n))\sube \mathrm{DTIME}(2^{O(S(n))}) $。

格局图(Configuration Graph)

回忆图灵机的格局:状态,纸带头位置,所有的纸带内容。

对于一个空间 \(S(n)\) 的图灵机,工作纸带内容最多 \(S(n)\) 有用。

对于任意空间 \(S(n)\) 的(非确定性)图灵机 \(M\) 和输入 \(x\in \{0,1\}^*\),其对应的格局图是一个有向图,其中每个节点对应 \(M\) 的所有可能的格局,从格局 \(C\) 到 \(C'\) 有边当且仅当根据 \(M\) 的转移函数,\(C\) 可以走一步到达 \(C'\),这个图记作 \(G_{M,x}\)。

可以修改 \(M\) 使得接受格局只有一个 \(C_{\text{accept}}\),则 \(M\) 接受输入 \(x\) 当且仅当 \(G_{M,x}\) 中存在一条从 \(C_{\text{start}}\) 到 \(C_{\text{accept}}\) 的有向路径。

如果 \(M\) 空间为 \(S(n)\),则格局图中的每一个点都可以由 \(c(S(n))\) 个比特位表示,在格局图上面 bfs/dfs 可以得到 \(\mathrm{NSPACE}(S(n))\sube \mathrm{DTIME}(2^{O(S(n))})\)。

空间复杂性类

\(\mathrm{PSPACE}=\cup_{c\ge 0}\mathrm{SPACE}(n^c)\)。

\(\mathrm{NPSPACE}=\cup_{c\ge 0}\mathrm{NSPACE}(n^c)\)。

\(\mathrm{L}=\mathrm{SPACE}(\log n)\)。

\(\mathrm{NL}=\mathrm{NSPACE}(\log n)\)。

注意到 \(\mathrm{NP}\sube \mathrm{PSPACE}\)。

\(\mathrm{PATH}=<G,s,t>\) 表示有向图 \(G\) 中是否存在 \(s\) 到 \(t\) 的路径,那么 \(\mathrm{PATH}\in \mathrm{NL}\),猜每一步往哪里走即可,而其是否属于 \(\mathrm{L}\) 还是 open 的。

Space Hierarchy Theorem:如果 \(f,g\) 是空间可构造的函数满足 \(f(n)=o(g(n))\),那么有 \(\mathrm{SPACE}(f(n))\subsetneq \mathrm{SPACE}(g(n))\)。

\(\mathrm{PSPACE}\)-Completeness

语言 \(L\in \mathrm{PSPACE-hard}\) 当 \(\forall L'\in \mathrm{PSPACE}\),\(L'\le_p L\);如果还有 \(L\in \mathrm{PSPACE}\),则称 \(L\in \mathrm{PSPACE-complete}\)。注意这里的 \(\le_p\) 还是多项式时间归约。

带量词的布尔表达式(QBF/Quantified Boolean Formula)的正确性是 \(\mathrm{PSPACE-complete}\) 的。

QBF 是一个形如 \(\psi=Q_1x_1Q_2x_2\dots Q_nx_n,\phi(x_1,x_2,\dots,x_n)\) 的布尔表达式,其中 \(Q_i\) 是 \(\forall\) 或者 \(\exists\),而 \(\phi\) 是一个普通的布尔表达式。

定义 \(\mathrm{TQBF}\) 为所有真的 QBF,其为 \(\mathrm{PSPACE-complete}\)。

具体而言解决 \(\mathrm{TQBF}\) 的算法就是按照顺序递归枚举 \(x_i\) 的取值即可,由于空间可以重复利用所以容易发现其属于 \(\mathrm{PSPACE}\)。

对于任意 \(L\in \mathrm{PSPACE}\),令 \(M\) 为在 \(S(n)\) 空间内判定 \(L\) 的图灵机,考虑 \(M\) 的格局图,令 \(m=O(S(n))\) 为需要编码 \(M\) 格局的比特数,则存在长度为 \(O(m)\) 的表达式 \(\phi_{M,x}\) 满足对于任意两个格局 \(C,C'\),\(\phi_{M,x}(C,C')=1\) 当且仅当 \(C\) 走一步可以到达 \(C'\)。

更一般地,我们可以构造一个多项式大小的 QBF \(\psi_i\) 满足对任意格局 \(C,C'\),\(\psi(C,C')=1\) 当且仅当 \(G_{M,x}\) 存在长度不超过 \(2^i\) 的 \(C\) 到 \(C'\) 的有向路径。

取 \(\psi_0=\phi\),而 \(\psi_i(C,C')=\exist C'',\psi_{i-1}(C,C'')\land \psi_{i-1}(C'',C)\),不过该转移每次大小乘以 \(2\) 不够优秀,注意到:

\[\begin{aligned} &\exists C'',\psi_{i-1}(C,C'')\land \psi_{i-1}(C'',C')\Leftrightarrow\\ &\exists C'',\forall D_1,\forall D_2,((D_1=C\land D_2=C'')\lor (D_1=C''\land D_2=C'))\Rightarrow \psi_{i-1}(D_1,D_2)\Leftrightarrow \end{aligned} \]

而 \(A=B\Leftrightarrow (A\land B)\lor (\lnot A\land \lnot B),A\Rightarrow B\Leftrightarrow \lnot A\lor B\),由此我们节省大小,记 \(S_i\) 表示 \(\psi_i\) 的大小,我们有 \(S_i=S_{i-1}+O(m)\),进而我们找到了多项式时间归约方法。

综上 \(\forall L\in\mathrm{PSPACE},L\le_p\mathrm{TQBF}\),由此 \(\mathrm{TQBF}\in\mathrm{PSPACE-complete}\)。

注意到上述证明没有要求 \(M\) 一定要是确定性图灵机,所以同样有 \(\mathrm{TQBF}\in\mathrm{NPSPACE-hard}\),进而 \(\mathrm{PSPACE}=\mathrm{NPSPACE}\)。

\(\mathrm{NL}\) 和 \(\mathrm{coNL}\)

回忆 \(\mathrm{NL}=\mathrm{NSPACE}(\log n)\)。

另一种等价定义:语言 \(L\in \mathrm{NL}\) 当存在确定性图灵机 \(M\)(验证机)以及一个额外的仅读一次的输入纸带(这个指的是输入的验证 \(u\)),以及一个多项式函数 \(P:N\to N\) 满足对于任意 \(x\),\(x\in L\) 当且仅当存在 \(u\in \{0,1\}^{P(|x|)}\) 满足 \(M(x,u)=1\),其中 \(M\) 最多使用 \(O(\log|x|)\) 额外工作纸带空间。

二者等价考虑验证和非确定性的关系即可。注意到仅读一次是因为 \(\log |x|\) 的空间使得其无法记录之前所有的选择。

类似 \(\mathrm{coNP}\),我们可以定义 \(\mathrm{coNL}\),例如 \(\lnot \mathrm{PATH}=\{<G,s,t>\}\) 满足 \(G\) 中不存在 \(s\) 到 \(t\) 的边,由于 \(\mathrm{PATH}\in \mathrm{NL-complete}\),同样有 \(\lnot\mathrm{PATH}\in\mathrm{coNL-complete}\)。

事实上可以证明 \(\lnot\mathrm{PATH}\in\mathrm{NL}\),从而 \(\mathrm{NL}=\mathrm{coNL}\)。

证明略,后面补。

更加一般化地,有对于任意空间可构造函数 \(S(n)\ge \log n\),有 \(\mathrm{NSPACE}(S(n))=\mathrm{coNSPACE}(S(n))\)。

总结:

\[\mathrm{L}\sube \mathrm{NL}=\mathrm{coNL}\sube \mathrm{P}\sube \mathrm{NP}\sube \mathrm{PSPACE}=\mathrm{NPSPACE}\sube \mathrm{EXP}\sube \mathrm{NEXP} \]

标签:语言,导论,笔记,图灵机,计算,NP,alpha,Sigma,mathrm
From: https://www.cnblogs.com/lsq147/p/18172957

相关文章

  • 【笔记】C# CancellationToken
    .NET提供了一个类方便用来发出操作取消的信号,这个类就是CancellationToken,它的好处在于它可以在任意数量的线程之间、线程池任务之间、Task之间传递信号,并且所需的代码很简单。通常用于下载超时中断、用户取消任务等情况。CancellationToken通常搭配CancellationTokenSource......
  • Go-分布式计算(全)
    Go分布式计算(全)原文:zh.annas-archive.org/md5/BF0BD04A27ACABD0F3CDFCFC72870F45译者:飞龙协议:CCBY-NC-SA4.0前言Go编程语言是在Google开发的,用于解决他们在为其基础设施开发软件时遇到的问题。他们需要一种静态类型的语言,不会减慢开发人员的速度,可以立即编译和执行,利......
  • Pick's Theorem 学习笔记
    Pick'sTheorem学习笔记UVA10088题目传送门题意:顺时针或逆时针地给出一个\(n\)个顶点(顶点都是整点)的简单多边形,求这个多边形内部的整点数量(位于多边形形上的整点不算)。Pick'sTheorem对于一个顶点都是整点的简单多边形:令\(I\)为多边形内部的整点数量,\(B\)为多边形形上......
  • 学习笔记:矩阵乘法
    矩阵乘法引入如果\(C=AB\),则\(c_{ij}=\sum\limits_{k=1}^{n}a_{ik}\cdotb_{kj}\),即\(A\)的第\(i\)行与\(B\)的第\(j\)列的点积。假设有\(n\)个地点,\(i\)到\(j\)做飞机有\(a_{ij}\)种选择,坐火车有\(b_{ij}\)种选择。求从\(i\)先做飞机再坐火车到......
  • WDS+MDT网络启动自动部署windows(十三)骚操作,修改MDT数据库,使用变量设置计算机描述
    简介我正在努力尝试将一个被取消的功能重新实现。在mdt安装时,为计算机添加计算机描述,它将是未来一些自动化操作的变量,如使用人参数。MDT2010-SettingtheComputerDescriptioninADwithoutawebservice-DeployVista在MDT部署期间在ActiveDirectory中设置计算机......
  • 计算机网络体系结构
    一、计算机网络概念1、计算机网络定义将分散的、具有独立功能的计算机系统,通过通信设备与线路连接起来,由功能完善的软件实现资源共享的系统。与多终端系统的区别:传统多终端系统是由中央处理器、多个联机终端及一个多用户操作系统组成。终端本身不具备独立的数据处理能力计算......
  • 计算机的操作系统
    计算机操作系统具备众多关键功能。它负责管理计算机的硬件资源,如CPU、内存、硬盘等,确保这些资源能够被合理分配和有效利用。通过进程管理,操作系统协调多个程序的运行,使它们能够有条不亲地共享系统资源,提高计算机的工作效率。文件系统则为数据的存储和管理提供了有序的结构,方便用......
  • 计算机的微机结构
    微机结构主要包括中央处理器(CPU)、存储器、输入/输出接口等部分。CPU是微机的“大脑”,它负责执行指令、进行运算和控制计算机的运行。CPU内部包含了运算器、控制器等重要组件,运算器能够进行各种数学和逻辑运算,控制器则负责指挥和协调各个部件的工作。存储器是计算机用来存储数......
  • P1028 [NOIP2001 普及组] 数的计算
    题目链接:观察样例。当输入\(n=6\)时,6本身算一个。当6后加的数为1时只有一个。6后加的数为2时有62,621两个。6后加的数为3时有63、631两个。可以看到,我们往\(n\)后加的每一个不超过\(\dfrac{n}{2}\)的数都可以继续延伸。考虑递推。\(f[i]\)表示以\(i......
  • QBXT五一集训DAY3笔记
    \(Day\)\(3\)位运算位运算包含了五个运算符,分别是:&与只有两个对应位都为\(1\)时才为\(1\)|或只要两个对应位中有一个\(1\)时就为\(1\)^异或只有两个对应位不同时才为\(1\)<<左移如\(n<<i\)表示将\(n\)的二进制向左移动\(i\)位,等价于\(n*2^i\)>......