背景
引理的内容
证明
以下使用元语言 叙述证明过程。读者可以自己转成以一阶逻辑语言表达的正式证明。
对于
T
{\displaystyle T}
中有一完全自由变数
x
{\displaystyle x}
的合式公式
A
(
x
)
{\displaystyle {\mathcal {A}}(x)}
,我们定义函数
f
:
N
→
N
{\displaystyle f:\mathbb {N} \to \mathbb {N} }
为:
f
(
#
A
(
x
)
)
=
#
[
A
(
∘
#
A
(
x
)
)
]
{\displaystyle f(\#_{{\mathcal {A}}(x)})=\#[{\mathcal {A}}(^{\circ }\#_{{\mathcal {A}}(x)})]}
其他状况下取
f
(
n
)
=
0
{\displaystyle f(n)=0}
。显然函数
f
{\displaystyle f}
是可计算的,故根据假设,存在合式公式
A
f
(
x
,
y
)
{\displaystyle {\mathcal {A}}_{f}(x,\,y)}
使得
⊢
T
(
∀
y
)
{
A
f
(
∘
#
A
(
x
)
,
y
)
⇔
[
y
=
∘
f
(
#
A
(
x
)
)
]
}
{\displaystyle \vdash _{T}\,(\forall y)\{{\mathcal {A}}_{f}(^{\circ }\#_{{\mathcal {A}}(x)},\,y)\Leftrightarrow [y=^{\circ }f(\#_{{\mathcal {A}}(x)})]\}}
(
1
)
{\displaystyle (1)}
然后对具有自由变数
y
{\displaystyle y}
的合式公式
F
(
y
)
{\displaystyle {\mathcal {F}}(y)}
,定义
B
(
x
)
{\displaystyle {\mathcal {B}}(x)}
为:
B
(
x
)
:=
(
∀
y
)
[
A
f
(
x
,
y
)
⇒
F
(
y
)
]
{\displaystyle {\mathcal {B}}(x):=(\forall y)[{\mathcal {A}}_{f}(x,\,y)\Rightarrow {\mathcal {F}}(y)]}
注意到一阶逻辑的公理模式 (参见量词公理 )
(
∀
y
)
D
(
y
)
⇒
D
(
S
)
{\displaystyle (\forall y){\mathcal {D}}(y)\Rightarrow {\mathcal {D}}(S)}
(
A
4
)
{\displaystyle (A4)}
D
(
S
)
{\displaystyle {\mathcal {D}}(S)}
是简记
D
(
y
)
{\displaystyle {\mathcal {D}}(y)}
内所有自由的
y
{\displaystyle y}
被取代成项
S
{\displaystyle S}
所得到的新合式公式(而并非 代表
D
(
y
)
{\displaystyle {\mathcal {D}}(y)}
只有一个组成变数);而(A4)要成立,必须额外要求:若
s
i
{\displaystyle s_{i}}
是组成
S
{\displaystyle S}
的其中一个变数,则
D
(
y
)
{\displaystyle {\mathcal {D}}(y)}
内自由的
y
{\displaystyle y}
都不被
s
i
{\displaystyle s_{i}}
的量词约束。(简称为项
S
{\displaystyle S}
对变数
y
{\displaystyle y}
于合式公式
D
(
y
)
{\displaystyle {\mathcal {D}}(y)}
是自由的)
(A4)配合(1)使用MP律 有
⊢
T
[
A
f
(
∘
#
A
(
x
)
,
y
)
]
⇔
[
y
=
∘
f
(
#
A
(
x
)
)
]
{\displaystyle \vdash _{T}\,[{\mathcal {A}}_{f}(^{\circ }\#_{{\mathcal {A}}(x)},\,y)]\Leftrightarrow [y=^{\circ }f(\#_{{\mathcal {A}}(x)})]}
所以从
B
(
x
)
{\displaystyle {\mathcal {B}}(x)}
的定义有
⊢
T
B
(
∘
#
A
(
x
)
)
⇔
(
∀
y
)
{
[
y
=
∘
f
(
#
A
(
x
)
)
]
⇒
F
(
y
)
}
{\displaystyle \vdash _{T}\,{\mathcal {B}}(^{\circ }\#_{{\mathcal {A}}(x)})\Leftrightarrow (\forall y)\{[y=^{\circ }f(\#_{{\mathcal {A}}(x)})]\Rightarrow {\mathcal {F}}(y)\}}
(
2
)
{\displaystyle (2)}
注意到从演绎定理 会有
D
1
⇒
(
D
2
⇒
D
3
)
,
D
2
⊢
T
D
1
⇒
D
3
{\displaystyle {\mathcal {D}}_{1}\Rightarrow ({\mathcal {D}}_{2}\Rightarrow {\mathcal {D}}_{3}),\,{\mathcal {D}}_{2}\vdash _{T}\,{\mathcal {D}}_{1}\Rightarrow {\mathcal {D}}_{3}}
(
D
)
{\displaystyle (D)}
D
1
⇒
D
2
,
D
2
⇒
D
3
⊢
T
D
1
⇒
D
3
{\displaystyle {\mathcal {D}}_{1}\Rightarrow {\mathcal {D}}_{2},\,{\mathcal {D}}_{2}\Rightarrow {\mathcal {D}}_{3}\vdash _{T}\,{\mathcal {D}}_{1}\Rightarrow {\mathcal {D}}_{3}}
(
D
′
)
{\displaystyle (D^{\prime })}
对定理(2)双箭头的后半部与公理模式(A4)使用MP律,然后套用(D')会有
⊢
T
B
(
∘
#
A
(
x
)
)
⇒
{
[
∘
f
(
#
A
(
x
)
)
=
∘
f
(
#
A
(
x
)
)
]
⇒
F
[
∘
f
(
#
A
(
x
)
)
]
}
{\displaystyle \vdash _{T}\,{\mathcal {B}}(^{\circ }\#_{{\mathcal {A}}(x)})\Rightarrow \{[^{\circ }f(\#_{{\mathcal {A}}(x)})=^{\circ }f(\#_{{\mathcal {A}}(x)})]\Rightarrow {\mathcal {F}}[^{\circ }f(\#_{{\mathcal {A}}(x)})]\}}
(
3
)
{\displaystyle (3)}
而从等号的性质(奠基于皮亚诺公理 ),对所有的项
S
{\displaystyle S}
有
⊢
T
S
=
S
{\displaystyle \vdash _{T}S=S}
故(3)配合(D)会有
⊢
T
B
(
∘
#
A
(
x
)
)
⇒
F
[
∘
f
(
#
A
(
x
)
)
]
{\displaystyle \vdash _{T}\,{\mathcal {B}}(^{\circ }\#_{{\mathcal {A}}(x)})\Rightarrow {\mathcal {F}}[^{\circ }f(\#_{{\mathcal {A}}(x)})]}
(
R
−
r
i
g
h
t
)
{\displaystyle (R-right)}
然后对等式和它的公理 (同样奠基于皮亚诺公理 )施用两次普遍化 ,然后与(A4)施用MP律两次会有:
若项
S
{\displaystyle S}
和
U
{\displaystyle U}
都对变数
y
{\displaystyle y}
于
F
(
y
)
{\displaystyle {\mathcal {F}}(y)}
自由,则
⊢
T
(
S
=
U
)
⇒
[
F
(
S
)
⇒
F
(
U
)
]
{\displaystyle \vdash _{T}\,(S=U)\Rightarrow [{\mathcal {F}}(S)\Rightarrow {\mathcal {F}}(U)]}
(
E
)
{\displaystyle (E)}
所以从(D)和演绎定理有
⊢
T
F
[
∘
f
(
#
A
(
x
)
)
]
⇒
{
[
∘
f
(
#
A
(
x
)
)
=
y
]
⇒
F
(
y
)
}
{\displaystyle \vdash _{T}\,{\mathcal {F}}[^{\circ }f(\#_{{\mathcal {A}}(x)})]\Rightarrow \{[^{\circ }f(\#_{{\mathcal {A}}(x)})=y]\Rightarrow {\mathcal {F}}(y)\}}
(
4
)
{\displaystyle (4)}
然后注意到另条量词的公理模式(若
y
{\displaystyle y}
于合式公式
D
{\displaystyle {\mathcal {D}}}
中完全不自由或不曾出现)
(
∀
y
)
(
D
⇒
E
)
⇒
[
D
⇒
(
∀
y
)
E
]
{\displaystyle (\forall y)({\mathcal {D}}\Rightarrow {\mathcal {E}})\Rightarrow [{\mathcal {D}}\Rightarrow (\forall y){\mathcal {E}}]}
(
A
5
)
{\displaystyle (A5)}
然后以普遍化 于定理(4)外面补上
∀
y
{\displaystyle \forall y}
,接着与(A5)一起套用MP律会有
⊢
T
F
[
∘
f
(
#
A
(
x
)
)
]
⇒
(
∀
y
)
{
[
∘
f
(
#
A
(
x
)
)
=
y
]
⇒
F
(
y
)
}
{\displaystyle \vdash _{T}\,{\mathcal {F}}[^{\circ }f(\#_{{\mathcal {A}}(x)})]\Rightarrow (\forall y)\{[^{\circ }f(\#_{{\mathcal {A}}(x)})=y]\Rightarrow {\mathcal {F}}(y)\}}
所以上面的定理和定理(2)配合(D')有
⊢
T
F
[
∘
f
(
#
A
(
x
)
)
]
⇒
B
(
∘
#
A
(
x
)
)
{\displaystyle \vdash _{T}\,{\mathcal {F}}[^{\circ }f(\#_{{\mathcal {A}}(x)})]\Rightarrow {\mathcal {B}}(^{\circ }\#_{{\mathcal {A}}(x)})}
(
R
−
l
e
f
t
)
{\displaystyle (R-left)}
总结(R-right)和(R-left),然后带入函数
f
{\displaystyle f}
的值有
⊢
T
B
(
∘
#
A
(
x
)
)
⇔
F
{
∘
#
[
A
(
∘
#
A
(
x
)
)
]
}
{\displaystyle \vdash _{T}\,{\mathcal {B}}(^{\circ }\#_{{\mathcal {A}}(x)})\Leftrightarrow {\mathcal {F}}\{^{\circ }\#[{\mathcal {A}}(^{\circ }\#_{{\mathcal {A}}(x)})]\}}
(
5
)
{\displaystyle (5)}
注意
B
(
x
)
{\displaystyle {\mathcal {B}}(x)}
内变数
x
{\displaystyle x}
是完全自由的,故可以把前面推导中所有的
A
{\displaystyle {\mathcal {A}}}
换成
B
{\displaystyle {\mathcal {B}}}
,然后定义
C
:=
B
(
∘
#
B
(
x
)
)
{\displaystyle {\mathcal {C}}:={\mathcal {B}}(^{\circ }\#_{{\mathcal {B}}(x)})}
那我们可以从定理(5)得到
⊢
T
C
⇔
F
(
∘
#
C
)
{\displaystyle \vdash _{T}\,{\mathcal {C}}\Leftrightarrow {\mathcal {F}}(^{\circ }\#_{\mathcal {C}})}
至此引理完成证明。
◻
{\displaystyle \Box }
历史
对角线引理跟可计算性理论 中的Kleene's recursion theorem有密切的联系,证明方法也相似。
这个定理之所以被冠以“对角线”,是因为它与康托尔 的对角论证法 的形式很相近。“对角线引理”或“不动点”的词汇并未出现在哥德尔 1931年所发表的划时代的论文中,也没有出现在塔斯基 1936年的论文中。卡尔纳普 是第一个人证明出:只要理论T满足某些条件,那么对于T中的任何式子ψ,都存在式子φ使得φ ↔ ψ(#(φ))在T中是可证的。由于在1934年尚未有可计算函数的概念,卡尔纳普是以别的用词去陈述该结论。Elliott Mendelson 认为是卡尔纳普首先指出哥德尔的论证中隐含地运用了对角线引理,而哥德尔则是在1937年注意到卡尔纳普的工作。[ 4]
注释
参考文献
^ See Boolos and Jeffrey (2002, sec. 15) and Mendelson (1997, Prop. 3.37 and Cor. 3.44 ).
^ Hinman 2005, p. 316
^ Smullyan (1991, 1994) are standard specialized references. The lemma is Prop. 3.34 in Mendelson (1997), and is covered in many texts on basic mathematical logic, such as Boolos and Jeffrey (1989, sec. 15) and Hinman (2005).
^ See Gödel's Collected Works, Vol. 1 , p. 363, fn 23.