图灵机

Howard Yin 2021-08-02 13:49:03 数学形式语言与自动机计算理论自动机

图灵机(Turing Machine, TM)在自动机领域也只是大大小小机器中的一个，但因其与可计算函数的等价性使得它成为自动机领域一类比较特殊的机器。

# 确定的图灵机的形式化定义

$M=(Q,\Sigma,\Gamma,\delta,q_0,B,F)$

$Q$
$\Sigma$
$\Gamma$
$\delta$
$q_0$
$B$
$F$

状态转移函数 $\delta$

当图灵机到达 $F$

例如 $(q_1,Y,L)=\delta(q_0,X)$

# 确定的图灵机的瞬时描述(Instantaneous Description, ID)

图灵机的输入虽然是有限长，在有限步内所到达的字符串的非空内容总是有限的，因此可以使用字符串和状态 $q$

$X_1X_2...X_{i-1}qX_iX_{i+1}...X_n$

$q$
$i$
$X_i,i\in[1,n]$

# ID转移： $\vdash$

在图灵机 $M$

$X_1X_2...X_{i-1}q_0X_iX_{i+1}...X_n\vdash_MX_1X_2...X_{i-2}q_1X_{i-1}YX_{i+1}...X_n$

在图灵机 $M$

$X_1X_2...X_{i-1}q_0X_iX_{i+1}...X_n\vdash_MX_1X_2...X_{i-1}Yq_1X_{i+1}X_{i+2}...X_n$

若某ID $I_1$

# 图灵机的语言

某个 图灵机 定义为 $M=(Q,\Sigma,\Gamma,\delta,q_0,B,F)$

$\bm L(M)=\{w\in\Sigma^*|(\exist p\in F,\alpha\in\Gamma^*,\beta\in\Gamma^*)q_0w\vdash_M^*\alpha p\beta\}$

递归可枚举语言/图灵可识别语言 ： $L=\bm L(M)$
递归语言/可判定语言 ： $L=\bm L(M)\wedge(\forall w\in\Gamma^*)\text{M能停机}$

注：图灵机不保证对所有字符串输入都停机。保证停机的图灵机在实际应用中是算法的好模型，是算法概念的形式化。

# 图灵机变种

以下的图灵机都可证明与确定的图灵机等价 ，但可以让图灵机的设计更加简单。

# 可以存储有限个符号的图灵机

$M=(Q',\Sigma,\Gamma,\delta,q_0',B,F)$

$Q'=Q\times\Gamma\times...\times\Gamma$
$q_0'=[q_0,B,...,B]$

# 多道图灵机

$M=(Q,\Sigma,\Gamma',\delta,q_0,B',F)$

$\Gamma'=\Gamma\times\Gamma\times...\times\Gamma$

# 半无穷带图灵机

字符串输入只有一侧是无穷的

# 多带图灵机

字符串输入有多个
图灵机在每个字符串上可以处于不同的位置
图灵机在每个字符串上的位置移动相互独立
图灵机在字符串上的移动除向左向右外，还可以是停止状态

# 非确定的图灵机(Nondeterministic Turing Machine, NTM)

$M=(Q,\Sigma,\Gamma,\delta,q_0,B,F)$

$\delta$ δ ：状态转移函数，
$\delta:Q\times\Gamma\rightarrow 2^{Q\times\Gamma\times\{L,R\}}$
δ : Q × Γ → 2 Q × Γ × { L , R }

类比NDA，NTM的状态转移函数输出为TM状态转移函数输出元组的集合，表示当前所有可能的状态转移过程

# 计算复杂性引入

运行时间 ：图灵机在某个输入上停机前移动的步数
时间复杂度 $T(n)$
只有保证停机的图灵机 $T(n)$
只有多项式时间的 $T(n)$

上面这些图灵机变种都与确定的图灵机等价，它们都能用来模拟确定的图灵机（显然），也都能被确定的图灵机所模拟。接下来看看如何模拟并分析一下模拟的时间复杂度。

# 用确定的图灵机模拟可以存储有限个符号的图灵机

显然，令确定的图灵机的状态集合为可以存储有限个符号的图灵机的所有可能的状态和存储符号的组合即可。模拟移动 $n$

# 用确定的图灵机模拟多道图灵机

显然，令确定的图灵机的输入为字符元组就是一个多道图灵机了。模拟移动 $n$

# 用确定的图灵机模拟可以存储有限个符号的多道图灵机

显然，令确定的图灵机的状态集合为可以存储有限个符号的图灵机的所有可能的状态和存储符号的组合，并令其输入为字符元组即可。模拟移动 $n$

# 用可以存储有限个符号的多道图灵机模拟多带图灵机

思路：对于 $k$

从左到右扫描一次，存储图灵机在所有带的位置和对应位置的输入
执行状态转移函数，存储图灵机在所有带的移动状态和要修改动作
从右到左扫描一次，按照移动状态修改道上的位置记录、按照修改动作修改道上的数据
重复1~3直到可接受状态

模拟移动1步需要左右扫描一次，时间复杂度 $O(n)$

# 用多带图灵机 $M$

思路：同NDA一样，NTM的运行过程也可以看作是树，其节点是ID，分支是由于NTM选择了多个状态转移而产生多个ID转移进而产生多个ID。若要用“串行”的图灵机模拟之，则可考虑对NTM运行时树上的ID进行广度优先搜索。

$M$

把第一条带开头的ID复制到第二条带
若第二条带上的ID可接受则停止
否则将第二条带上的可能的ID转移复制到第一条带的末端
抹去第二条带开头的ID
重复1~4

模拟每个ID都要读取复制和删除长度为 $n$

# $P=NP$

前面分析出来了用NTM能用多带图灵机进行模拟，但模拟需要指数时间，但这只是一种最直观的模拟方法，是否存在多项式时间的模拟方法？目前还是未知的。

这个问题可以概括为：NTM以多项式时间解决的问题，TM是否也可以以多项式时间解决？

简称 $P=NP$

$P$
$NP$
“ $NP$

虽然问题目前还没解决，但是实际应用中通常认为 $P\not ={NP}$

# 图灵机的二进制表示

显然，由 $0$

# 对 $\Sigma^\ast=(\bm 0+\bm 1)^\ast$

将 $(\bm 0+\bm 1)^*$

$(i)_2=1w_i$

因此可以构造如下编码

$i$	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$\dots$
$(i)_2$	$1\varepsilon$	$10$	$11$	$100$	$101$	$110$	$111$	$\dots$
$w_i$	$\varepsilon$	$0$	$1$	$00$	$01$	$10$	$11$	$\dots$

# 对图灵机的状态转移函数编码

令
$Q=\{q_1,q_2,\dots,q_{|Q|}\}$
Q = { q 1 , q 2 , … , q ∣ Q ∣ } ，从而每一个状态可以由一个数字表示

开始状态为 $q_1$
令 $\Gamma=\{X_1,X_2,\dots,X_{|\Gamma|}\}$
令移动方向 $L=D_1$

因此，图灵机的每一个状态、输入符号和移动方向都可以由一个数字表示，进而根据 $01$

由于图灵机的状态转移函数 $\delta:Q\times\Gamma\rightarrow 2^{Q\times\Gamma\times\{L,R\}}$

$\Delta=\left\{(q,X)\rightarrow(q',X',D)|q,q'\in Q\wedge X,X'\in\Gamma\wedge D\in\{L,R\}\right\}$

在此定义下的状态转移函数则表示为：

$\delta(q,X)=(q',X',D)\quad(q,X)\rightarrow(q',X',D)\in\Delta$

而根据上述编码规则，任何一个转移规则 $(q_i,X_j)\rightarrow(q_k,X_l,D_m)\in\Delta$

$C=0^i10^j10^k10^l10^m\quad\delta(q_i,X_j)=(q_k,X_l,D_m)$

# 对图灵机编码

根据上面的分析可以看出，所有的图灵机的状态、输入符号和移动方向都可以由相同的编码方式表示，不同的图灵机本质上只在转移规则上有所不同，因此对一个图灵机的编码就是对其转移规则的编码。

因此，根据上述对图灵机的状态转移函数编码规则，我们可以将图灵机编码为一个由状态转移规则的编码组成的字符串，中间用两个字符 $1$

$C_111C_211C_311\dots C_{n-1}11C_n$

即得到图灵机编码，也即图灵机的二进制表示。

进而根据对 $\Sigma^*=(\bm 0+\bm 1)^*$

$\text{图灵机}M_i:=\text{编码为}w_i\text{的图灵机}$

# 通用图灵机

# 对角化语言 $L_d$

对角化语言是所有不能接受自身编码的图灵机的编码组成的集合：

$L_d=\{w_i|w_i\not\in\bm L(M_i)\}$

注： $L_d$

图灵机 $\rightarrow$
字符串 $\downarrow$	$M_1$	$M_2$	$M_3$	$M_4$	$M_5$	$\dots$
$w_1$	拒绝	拒绝	接受	接受	拒绝
$w_2$	接受	拒绝	拒绝	接受	拒绝
$w_3$	拒绝	接受	接受	拒绝	拒绝
$w_4$	拒绝	拒绝	接受	接受	接受
$w_5$	接受	接受	拒绝	拒绝	拒绝
$\vdots$

# 证明对角化语言不是图灵可识别语言（不存在识别它的图灵机）

假设有一个图灵机 $M_i$

$L_d=\bm L(M_i)$

那么有对于它的编码 $w_i$

$\begin{aligned} &w_i\in L_d\\ \Leftrightarrow&w_i\in\{w_i|w_i\not\in\bm L(M_i)\}&L_d\text{的定义}\\ \Leftrightarrow&w_i\not\in\bm L(M_i)&L_d\text{的定义}\\ \Leftrightarrow&w_i\not\in L_d&L_d=\bm L(M_i)\\ \Rightarrow&\text{矛盾}\\ \end{aligned}$

因此识别对角化语言的图灵机不存在，故对角化语言不是递归可枚举语言。

# 通用语言 $L_u$

根据上文所属的编码方式，我们可以将图灵机 $M_i$

$w_i111w$

进而构造一种“通用语言”：

$L_u=\{w_i111w|w\in L(M_i)\wedge i\in\mathbb N\}$

# 证明通用语言是图灵可识别语言（通用图灵机 $U$

可以构造一个多带图灵机 $U$

读取 $w_i$
读取 $w$
第三条带存储 $M_i$

从而模拟图灵机 $M_i$

这里的 $U$

# 证明通用语言不是可判定语言（不能保证所有输入全部停机）

我们可以用通用语言 $L_u$

$L_{du}=\{w_i111w_i|w_i\not\in\bm L(M_i)\}\subset L_u$

进而：

$\begin{aligned} &L_u\text{是可判定语言}&\\ \Leftrightarrow&U\text{在}L_u\text{上保证停机}&\text{可判定语言定义}\\ \Rightarrow&U\text{在}L_{du}\text{上保证停机}&L_{du}\subset L_u\\ \Leftrightarrow&U\text{可识别}L_d&L_{du}\text{和}L_u\text{等价}\\ \Rightarrow&L_d\text{是图灵可识别语言}&\text{图灵可识别语言定义}\\ \Rightarrow&\text{矛盾}&L_d\text{不是图灵可识别语言}$

图灵机

图灵机