, )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥...

88
2011.5. 第07期

Transcript of , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥...

Page 1: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

2011.5.

第07期

Page 2: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

目录

名家名篇

关于定积分的一个推广 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .H. Lebesgue 1

研究探讨

Lebesgue分解定理条件的一个改进 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .刘诗南 4鲁洛三角形转动时的轨迹和面积等问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .刘立达 8关于一个子群格所对应的群及其Galois理论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .潘锦钊 15S2上不存在非零连续切向量场的一个分析证明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .苏桃 31

专题介绍

随机控制简介——离散型随机控制问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .冯鑫 37高等代数中的拓扑 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .张端阳 43椭圆曲线及其j-不变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .毛天一 52A glimpse at the Jacobi ϑ-function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .杨迪 63

教师来稿

从1 + 2 + · · · + 100 = 5050谈起: 第二部分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .周坚 68

数学史话

希尔伯特和闵可夫斯基对爱因斯坦如何看待物理与数学之关系的影响 . . . . .Leo Corry 75

Page 3: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t
Page 4: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

关于定积分的一个推广

H. Lebesgue 先生

编者按 1901年4月29日,法国数学家Henri Lebesgue在《巴黎科学院通报》(Comptes

Rendus de l’Academie des Sciences de Paris)上发表了一篇题为《关于定积分的一个

推广》(Sur une generalisation de l’integrale definie)的短文,奠定了Lebesgue测度与

积分理论的基础。今年恰逢其110周年,我们将这篇开山之作译出,以飨读者。需要

指出的是,当年Lebesgue为避免同Riemann可积混淆,采用了形容词sommable(可和

的)来表示一个函数在他的意义下可积,现在则称之为Lebesgue可积。

积分的观念与原函数的观念在连续函数的情形下有着同一性. Riemann定义了某些不

连续函数的积分, 但并不是所有导函数都是在Riemann的意义下可积的. 因而, 原函数的研

究问题并未由积分得以解决. 于是, 我们希望有一个积分的定义, 可以解决原函数问题, 同

时包含Riemann积分的定义作为特例(1).

为定义一个连续递增函数

y(x) (a ≤ x ≤ b)

的积分, 我们把区间(a, b) 划分为一些子区间, 用每个子区间的长度乘以这个区间某点x

对应的y 值, 然后求这些乘积的和. 如果x 属于某区间(ai, ai+1), 则y 在某两个极限值mi

和mi+1 之间变动;相反,如果y 在mi 和mi+1 之间, 则x在ai 和ai+1 之间. 因此, 代替给出x

变动的划分, 即给出那些ai, 我们还可以给出y 变动的划分, 即那些mi. 于是有两种方法推

广积分的观念. 我们知道第一种方法(给出那些ai) 导出Riemann的定义以及Darboux利用

上、下和得到的定义.让我们来看第二种方法.

令函数1 y 在m 和M 之间变动. 给定

m = m0 < m1 < m2 < ... < mp−1 < M = mp

当x属于集合E0 时, y = m; 当x属于集合Ei时, mi−1 < y ≤ mi. 我们进一步定义这些集合

的测度为λ0, λi. 考虑以下两个和的一个:

m0λ0 +∑

miλi; m0λ0 +∑

mi−1λi;

1译注: 指函数值.

1

Page 5: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

如果, 当相邻两个mi之间的间隔的最大值趋于零时, 这些和趋于同一个极限而不依赖

于mi的选取, 则我们将定义这个极限为y 的积分, 并称y 是可积的.

让我们来考查一个由(a, b)中的一些点组成的集合; 我们可以有无穷多种方法来[用

可数无穷多个区间]包围[这个集合]; 这些区间的长度的总和的下确界被称为这个集合

的测度2. 一个集合E被称之为是可测的, 如果其测度加上不属于E的点的集合的测度给

出(a, b)的测度(2). 以下有两个关于这类集合的性质: 给定无穷多个可测集Ei, 至少属于它

们中一个的那些点所组成的集合是可测的; 如果这些Ei两两没有公共点, 所有Ei的测度之

和就是这个得到的集合的测度. 所有Ei的公共点组成的集合是可测的.

自然地, 首先要考虑这样一些函数, 其出现在积分定义中的集合是可测的. 我们发

现: 如果一个绝对值有上界的函数满足, 对任意A和B, 使得A < y <= B的x值的集合是

可测的,则它按如上指出的过程是可积的. 这种函数被称作是可和的. 一个可和函数的

积分是取值在其上积分和下积分之间. 因此, 如果一个在Riemann意义下可积的函数是可

和的,则两种定义下的积分是相同的. 然而, 所有的Riemann可积的函数都是可和的, 因

为Riemann可积函数不连续点的全体是一个零测集, 而且我们可以证明, 如果忽略掉那些

定义在零测集中的点x, 在剩下的点所组成的集合上, 这个函数是连续的, 那么这个函数一

定是可和的. 这个性质立即使我们能构造出在Riemann意义下不可积然而却可和的函数.

令f(x)和φ(x)是两个连续函数, φ(x)不恒为零. 考查一个与f(x)至多在一个零测集上不同

的函数, 要求这个零测集在整个积分区域上稠密而且在这些点上这个函数等于f(x) + ϕ(x),

则这个函数是可和的但却不必是Riemann可积的. 例子: x为无理数时取值为0, x为有理数

时取值为1的那个函数. 上述构造过程显示出, 可和函数的集合比起连续函数的集合具有优

越性. 如下是这类函数的两个性质:

1 如果f和φ都可和, 那么f + φ也可和, 并且f + φ的积分等于f与φ的积分之和.

2 如果一个可和函数的序列有极限, 那么这个极限也是可和的.

可和函数之集显然包含y = k和y = x; 因此根据1, 该集合包含所有多项式, 并且根

据2, 包含它们所有的极限, 从而包含所有连续函数, 即第一类函数(参见Baire, Annali di

Matematica, 1899), 该集合还包含第二类函数, 等等. 特别地, 所有的绝对值有上界的导

函数, 由于属于第一类, 因而是可和的, 并且可以证明, 它的积分, 视为其上限的函数, 是它

的一个原函数.

2校注: 原文为on peut d’une infinite de manieres enfermer de la somme des longuers de ces intervalles;

la limite inferieure de la somme des longueurs de ces intervalles est la mesure de l’ensemble. 前半句不通,

疑“de la somme des longuers de ces intervalles”为误印. 按我们的理解, 此处是在定义Lebesgue外测度, 故加

上了中括号中的文字.

2

Page 6: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

下面是一个几何方面的应用:若|f ′|, |φ′|, |ψ′|有界,那么曲线的长度由√f ′2 + φ′2 + ψ′2的

积分给出. 若φ = ψ = 0, 我们得到的是这个有界变差函数f的全变差. 当f ′, φ′, ψ′不存在时,

我们通过将导数替换为Dini导数, 可以得到一个几乎一样的定理.

(1901年4月29日)

注记:

(1) 对于积分的所有的推广, 我们先验地给出的这两个情况显然是协调的, 因为所有

在Riemann意义下可积的导函数, 其积分是它的原函数之一.

(2) 如果我们在这个集族中加上一些合适的零测集, 我们得到的是Borel先生意义下的

可测集之族(Lecons sur la theorie des fonctions).

(刘春晖3、文豪4、杨迪5 译; 杜升华6 校)

数学名言

对于个人的成功发展,获取知识所起的作用,比发展能力所起的作用要小得多。

——摘自《数学在19世纪的发展》(第一卷), F. Klein

3PhD09-student4PhD10-student5PhD08-student6PhD09-student

3

Page 7: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

Lebesgue分解定理条件的一个改进

刘诗南∗

在[1]第384页写道:

“Lebesgue分解定理:设(X, M, µ)是一个σ-有限测度空间,v是可测空间(X, M)上的

一个σ-有限测度,则存在(X, M)上的测度v0, v1,使得v0关于µ奇异而v1关于µ绝对连续,

且v = v0 + v1,并且这个分解是唯一的。”1

我们指出,定理的条件“µ是σ-有限”是不必要的。

证明 先证明唯一性。

假设存在满足定理条件的两种分解v = v0 + v1 = v′0 + v′

1,其中v0, v′0关于µ奇异,

v1, v′1关于µ绝对连续。根据v0, v

′0关于µ奇异,存在可测集A,A′, B, B′,使得A ∩ B = A′ ∩

B′ = ∅,A ∪ B = A′ ∪ B′ = X,且v0(A) = µ(B) = 0, v′0(A

′) = µ(B′) = 0。

因为v1 ≪ µ, v′1 ≪ µ,而µ(B) = 0,故v1(B) = v′

1(B) = 0,从而对任意可测集E,

v1(E ∩ B) = v′1(E ∩ B) = 0。又由于v0(E ∩ B) + v1(E ∩ B) = v(E ∩ B) = v′

0(E ∩ B) +

v′1(E ∩ B),故v0(E ∩ B) = v′

0(E ∩ B), ∀E ∈ M。

因为v0(A) = 0,所以∀E ∈ M, v0(E ∩ A) = 0,从而∀E ∈ M, v0(E) = v0(E ∩ A) +

v0(E∩B) = v0(E∩B) = v′0(E∩B) 6 v′

0(E)。同理,v′0(E) 6 v0(E),从而v0(E) = v′

0(E)。

因为v是σ-有限测度,故存在X的一个两两不交的分解X =∪∞

k=1 Xk,使得Xk是可测

集并且v(Xk) < ∞, ∀k > 1。从而∀E ∈ M, k > 1,有

v0(E ∩ Xk) + v1(E ∩ Xk) = v(E ∩ Xk) = v′0(E ∩ Xk) + v′

1(E ∩ Xk)

∗基数811一个可测空间(X, M)是指一个非空集合X和一个由X的子集构成的σ-代数M。X的子集A称为可测,如

果A ∈ M。可测空间(X, M)上的一个测度是指一个非负扩充实值函数µ : M → [0, ∞]满足µ(∅) = 0,以及

任意可数个两两不交的可测集Ek∞k=1,有µ

(∪∞k=1 Ek

)=

∑∞k=1 µ(Ek)。测度µ是可测空间(X, M)上的σ-有

限测度是指存在一列两两不交的可测集Xk∞k=1,使得

∪∞k=1 Xk = X且∀k > 1, µ(Xk) < ∞。设µ, v是可测

空间(X, M)上的两个测度,v关于µ绝对连续(记作v ≪ µ),是指如果∀E ∈ M, µ(E) = 0 ⇒ v(E) = 0。v关

于µ奇异(或者称为v与µ相互奇异,记作v ⊥ µ)是指存在不交的可测集A, B,使得X = A ∪ B且v(A) =

µ(B) = 0。

4

Page 8: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

而且v(E ∩ Xk) 6 v(Xk) < ∞。因为v0(E ∩ Xk) = v′0(E ∩ Xk) < ∞,两边约去这一项,得

到v1(E ∩ Xk) = v′1(E ∩ Xk), ∀k > 1。从而

v1(E) = v1

( ∞∪

k=1

(E ∩ Xk)

)

=∞∑

k=1

v1(E ∩ Xk)

=

∞∑

k=1

v′1(E ∩ Xk)

= v′1

( ∞∪

k=1

(E ∩ Xk)

)

= v′1(E)

从而也有v1 = v′1。这样就证明了分解的唯一性。

接下来说明分解的存在性。

如果定理对v是有限测度的情形成立,则当v是σ-有限测度时,定义Xk∞k=1如前,

且对每个k > 1,记µ(k)和v(k)分别是µ和v在Xk上的限制。显然v(k)是Xk上的有限测度。

从而根据假设,存在Xk上的测度v(k)0 , v

(k)1 ,使得v

(k)0 ⊥ µ(k), v

(k)1 ≪ µ(k),且v(k) =

v(k)0 + v

(k)1 。∀E ∈ M,定义v0(E) =

∑∞k=1 v

(k)0 (E ∩ Xk),v1(E) =

∑∞k=1 v

(k)1 (E ∩ Xk)。

设Ej∞j=1是X中一列两两不交的可测集,则

v0

∞∪

j=1

Ej

=

∞∑

k=1

v(k)0

(

∞∪

j=1

Ej

)∩ Xk

=

∞∑

k=1

∞∑

j=1

v(k)0 (Ej ∩ Xk)

=

∞∑

j=1

∞∑

k=1

v(k)0 (Ej ∩ Xk)

=

∞∑

j=1

v0(Ej)

(其中求和号的可交换性可由N上的计数测度是σ-有限测度和Tonelli定理看出。)

5

Page 9: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

从而v0是(X, M)上的测度,同理v1也是(X, M)上的测度。∀E ∈ M,我们有

v0(E) + v1(E) =∞∑

k=1

v(k)0 (E ∩ Xk) +

∞∑

k=1

v(k)1 (E ∩ Xk)

=

∞∑

k=1

(v

(k)0 (E ∩ Xk) + v

(k)1 (E ∩ Xk)

)

=

∞∑

k=1

v(k)(E ∩ Xk)

=

∞∑

k=1

v(E ∩ Xk)

= v(E)

即v = v0 + v1。

因为v(k)0 ⊥ µ(k),故对每个k > 1,存在Xk中可测集Ak, Bk,使得Ak ∪ Bk = Xk, Ak ∩

Bk = ∅,且v(k)0 (Ak) = µ(k)(Bk) = 0。令A =

∪∞k=1 Ak, B =

∪∞k=1 Bk,因为Xk∞

k=1两两

不交,所以A ∩ B = ∅,且A ∪ B =∪∞

k=1(Ak ∪ Bk) = X,v0(A) =∑∞

k=1 v(k)0 (A ∪ Xk) =

∑∞k=1 v

(k)0 (Ak) = 0,µ(B) =

∑∞k=1 µ(Bk) = 0,所以v0 ⊥ µ。

如果E ∈ M使得µ(E) = 0,则∀k > 1, µ(E ∩Xk) = 0。根据v(k)1 ≪ µ(k),知道v

(k)1 (E ∩

Xk) = 0,所以v1(E) =∑∞

k=1 v(k)1 (E ∩ Xk) = 0,即v1 ≪ µ。

所以我们由v是有限的情形推出了v是σ-有限的情形。

最后我们证明v是有限测度时分解的存在性。

假设v(X) < ∞。令k1 = supv(E)|µ(E) = 0, E ∈ M,则k1是非负实数。由k1的定

义,存在E1 ∈ M使得µ(E1) = 0且v(E1) > k1/2。

假设我们已经定义好了E1, · · · , En−1和k1, · · · , kn−1,使得µ(E1) = · · · = µ(En−1) =

0且µ(Ei) > ki/2,且Ei ⊆ X ∼ (E1 ∪ · · · ∪ Ei−1), i = 1, · · · , n − 1。定义

kn = supv(E)|E ⊆ X ∼ (E1 ∪ · · · ∪ En−1)是可测集且µ(E) = 0

再取En ⊆ X ∼ (E1 ∪ · · · ∪ En−1)使得µ(En) = 0, v(En) > kn/2。则我们定义了一个集

列En∞n=1。

因为En两两不交,所以∞∑

n=1

kn

26

∞∑

n=1

v(En) = v

( ∞∪

n=1

En

)6 v(X) < ∞

所以kn → 0当n → +∞。记B =

∪∞n=1 En, A = X ∼ B,则A ∩ B = ∅, A ∪ B = X。

6

Page 10: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

∀E ∈ M,定义v0(E) = v(B ∩ E), v1(E) = v(A ∩ E),容易验证v0, v1是(X, M)上的测

度,且v = v0 + v1,并且v0(A) = v(B ∩ A) = 0, µ(B) = µ (∪∞

n=1 En) =∑∞

n=1 µ(En) = 0,

所以v0 ⊥ µ。

∀E ∈ M,若µ(E) = 0,则µ(E ∩ A) = 0,但∀n > 1, A ∩ E ⊆ A = X ∼∪∞

i=1 Ei ⊆X ∼ (E1∪· · ·∪En−1),所以根据kn的定义,v(E∩A) 6 kn。令n → +∞得到v(E∩A) = 0,

即v1(E) = 0,即v1 ≪ µ。

这样我们就证明了整个定理。

参考文献

[1] H. L. Royden, P. M. Fitzpatrick, Real Analysis (Fourth Edition). 北京:机械工业出

版社,2010。

数学名言

(黎曼)不论在哪个地方,只要他的兴趣被激发了起来,他都会从头开始,从不让自己

被传统引入歧途,对那种要求自己的科学工作成为一个体系的压力,他也从不屈从。

——摘自《数学在19世纪的发展》(第一卷), F. Klein

7

Page 11: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

鲁洛三角形转动时的轨迹和面积等问题

刘立达∗

摘要

分别以等边三角形的三个顶点为圆心、边长为半径作圆弧,三段圆弧就围成鲁洛

三角形。本文计算了当鲁洛三角形在一个正方形里旋转时,它的中心的轨迹、顶点的

轨迹以及旋转中所覆盖的面积。

关键词:鲁洛三角形,轨迹

鲁洛三角形(Reuleaux triangle)是分别以等边三角形的三个顶点为圆心、边长为半

径作圆弧,三段圆弧围成的曲边三角形。鲁洛三角形是最简单的定宽曲线,可以在一个正

方形范围里旋转;在工业上可以用鲁洛三角形的钻头钻方形孔(实际上顶点钻不到,得到

的是圆角方形孔)。

然而,显而易见的是,如果直接固定鲁洛三角形钻头的中心,使其绕中心旋转的话,

那么其钻出的孔必然是圆而不是正方形。由此自然而然地引发如下问题:为了使鲁洛三角

形钻头能够钻出正方形孔,其中心应当如何移动?或者换个问法,如下:

问题1. 在边长为2r的正方形Γ内塞入一个定宽为2r的鲁洛三角形Π,且其顶点分别

为A,B,C(如图1);求Π在Γ中转动时,其中心P点的轨迹。

此外,还可以进一步追问:

问题2. 求上述鲁洛三角形Π在Γ内转动时,其边界∂Ω的方程和扫过的图形Ω的面积。

在进行计算之前,为了保证计算时的每一步有据可依,先证明如下引理(可参考

图1):

引理1. 在平面直角坐标系中,一个等边三角形的任一顶点至多只能在一个方向(或x或y)

上位于其他两个顶点的中间(若顶点连线垂直于坐标轴也算),而在另一个方向上靠边;

或者在两个方向上都靠边。

∗原基科58–基数53班毕业生。现为南开大学金融发展研究院二年级研究生,金融工程专业。

8

Page 12: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

图 1 正方形中的鲁洛三角形

证明很简单,因为如果在两个方向上都居于中间,那么该顶点的角必然大于π/3,与

等边三角形矛盾。

引理2. 如果Π的一个顶点位于Γ的某一条边上,则另两个顶点必然在平行于该边的方向上

分居其两侧。

证明. 假设不然。不妨设顶点A位于Γ的边∂Γ上,而B,C依次位于A的同侧,B位于A和C之

间。

那么,考察øAC。从B向A所在的边做垂线,并交øAC于D。显然,由于BD = 2r,

故D一定不会位于Γ的内部。

若D位于Γ以外,则与Π位于Γ之内矛盾;若D位于∂Γ上,则易知此时D与A重合,

即AB连线平行于Γ的一条边;而此时可以认为A位于B,C中间。

综上所述,引理得证。

引理3. Π至少有两个顶点位于Γ的边上。

证明. 首先可以证明,Π至少有一个顶点位于∂Γ上。

反证法,如果三个顶点都位于Γ的内部,那么必然没有任何两个顶点的连线平行

于Γ的边(因为连线长度等于2r)。

所以,从平行于Γ的边的方向看去,Π的三个顶点必有一个位于另两个的中间。不妨

设在x方向上,A在B, C中间;则根据引理1,A在y方向上位于B, C以外。

显然,若平行于y方向过A做直线,则此直线与øBC必有交点D;而由于AD = 2r且AD平

行于Γ的边,A位于Γ的内部,故D必然位于Γ以外。这意味着øBC有一段位于Γ以外,与已

知矛盾。

9

Page 13: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

因此,Π至少有一个顶点位于∂Γ上。

设顶点A位于∂Γ上,下证还有另一个顶点位于其上。

反证法。若B, C都位于Γ的内部,则易知BC不平行于Γ的任一边。从而,在垂直

于A所在边的方向上,B和C必有一点位于另两点之间。不妨设为B。

那么,由前面的证明可知,øAC必有一段位于Γ之外,矛盾。

因此,A和B都位于∂Γ上。

另外,容易知道三个顶点不同时位于∂Γ上是可以的。

引理4. Π的每条弧都与Γ有至少两个公共点(含顶点)。

证明. 由引理3,知Π有至少两个顶点位于∂Γ上,不妨设为A和B。

那么,只需考察øAC和øBC。

当AB不平行于Γ的任一一条边时,可从B向Γ的边引垂线,由引理2,该垂线必

与øAC相交于一点E,且BE = 2r(鲁洛三角形的定义);从而,E必然位于∂Γ上,故øAC与∂Γ有

另一个公共点。

同理可知,øBC与∂Γ也有另一个公共点。

若AB平行于Γ的某条边,则直接计算可知C位于∂Γ上。

此外,容易证明若一个公共点不是Π的端点,则该公共点是Π与Γ的切点。

下面进行计算。显然,P点的位置就是ABC的中心。

首先计算两个特殊情形的P点位置:边位和角位。如图2。

图 2 边位和角位

10

Page 14: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

边位:BC平行于Γ的一边。

过A做BC的垂线交BC于D。

由于AB = 2BD = 2r,故AD =√

3r,AP = 2√

33 r,从而OP = (2

√3

3 − 1)r ≈0.1547r。P位于AO的延长线上,趋向底边弧。

角位:BC与Γ的边成π/4夹角。

连结顶点A与Γ的对角E,AE交BC于D。

那么容易算出,ED = BD = CD = r,PE = PD + ED = (√

33 + 1)r,OE =

√2r,

OP = (√

33 + 1 −

√2)r ≈ 0.1631r。P位于AO上,趋向顶角。

令Π在Γ中转动,如图3。

图 3 转动的鲁洛三角形

观察图3,发现如下规律:Π在Γ中的转动,实际上是不断地从边位连续转动到角位,

再连续转动到边位,如此反复;当Π顺时针转动时,P点围绕O点逆时针转。而由于旋转

对称性,我们实际上只需要考察一个“边-角-边”的过程,即图3的前3幅图即可。

以Γ的中心O为原点,平行于Γ的两边分别为x轴,y轴,建立平面直角坐标系(如下

图4)。设∠ABE = θ,由上面的分析,我们只需要计算从θ = π/6(A = A1)到θ = π/3(A =

A2)的情况即可。此时只有顶点C不位于∂Γ上。

容易算出三个顶点的坐标:

A = ((2 sin θ − 1)r, r),

B = (−r, (1 − 2 cos θ)r),

C = (xB + 2r cos(θ − π/6), yB − 2r sin(θ − π/6))

= ((√

3 cos θ + sin θ − 1)r, (1 −√

3 sin θ − cos θ)r).

最后得到点P的参数方程:

P =A + B + C

3

= ((sin θ +

√3

3cos θ − 1)r, (1 − cos θ −

√3

3sin θ)r), θ ∈ [

π

6,π

3].

11

Page 15: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

图 4 轨迹的计算

将其进一步消参,则得到普通方程:

(x

r+ 1)2 +

√3(

x

r+ 1)(

y

r− 1) + (

y

r− 1)2 =

1

3(x ≥ 0, y ≤ 0).

这是一个倾斜的椭圆(图5)的右下角(第四象限部分),该椭圆的中心为(−r, r),长轴

为y = −x,短轴为y = x + 2r;其第四象限部分与坐标轴交点处的切线垂直于坐标轴:而

整个图形就是四个如此的曲线拼在一起。该椭圆的标准方程为

3x2

(√

3 + 1)2r2+

3y2

(√

3 − 1)2r2= 1.

至此,我们完成了问题1的完整解答。

接下来看问题2。其实它可以算是问题1的衍生问题。

由上述讨论可知,如果一个顶点C位于∂Γ上时,C的运动轨迹毫无疑问是线段;如若

不然,点C的坐标为

C = ((√

3 cos θ + sin θ − 1)r, (1 −√

3 sin θ − cos θ)r), θ ∈ [π

6,π

3].

直接消参即得到其方程为

(x

r+ 1)2 +

√3(

x

r+ 1)(

y

r− 1) + (

y

r− 1)2 = 1,

其中x ∈(√

3 − 1)r, r, y ∈

−r, (1 −

√3)r。

该椭圆的中心位置和倾斜方向与P的轨迹完全相同,唯一的区别是在x, y方向上都等

比例放大为P的√

3倍。其中,C的轨迹也是右下角的一段,其端点处的切线平行(或者说

12

Page 16: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

图 5 鲁洛三角形中点轨迹(θ ∈ [0, 2π])

垂直)于坐标轴。因此,无论是C还是P的轨迹,其各个分段之间都是平滑连接的。该椭

圆的标准方程为x2

(√

3 + 1)2r2+

y2

(√

3 − 1)2r2= 1.

综合起来,可以得出关于C在第四象限的轨迹,亦即∂Ω的四分之一的结论:

∂Ω4(x) =

8>><>>:

y = −r, 0 ≤ x ≤ (√

3 − 1)r , x ∈ [0, (√

3 − 1)r]时;

(xr + 1)2 +

√3(x

r + 1)(yr − 1) + (y

r − 1)2 = 1 , x ∈ ((√

3 − 1)r, r)时;

x = r, (1 −√

3)r ≤ y ≤ 0 , x = r时.

而总轨迹∂Ω就是四段如此的轨迹拼在一起。

有了方程,就可以很容易地求Ω的面积。由对称性,只需计算一个象限的面积,不妨

计算第四象限。求法多种多样,以下是最直接的方法。

首先可以根据方程求出y的表达式:

(x

r+ 1)2 +

√3(

x

r+ 1)(

y

r− 1) + (

y

r− 1)2 = 1

⇒ y(x) =(2 −

√3)r −

√3x −

√3r2 − 2xr − x2

2.

13

Page 17: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

所以,Ω在第四象限的面积为

SΩ4 =Z r

0|∂Ω4(x)| dx

=√

3 − 1r2 +

Z r

(√

3−1)r|y(x)| dx

=√

3 − 1r2 +

√3 − 2 +

π

6

r2

=2√

3 − 3 +π

6

r2

≈ 0.9877r2.

因此,Π转动一周后所覆盖的图形Ω的面积接近正方形Π的99%,已经相当精确;而实

际上容易算出,即使只考虑圆角部分(即在x ∈(√

3 − 1)r, r, y ∈

−r, (1 −

√3)r这个正

方形内),Ω的覆盖率也将超过82.8%。如图6。

图 6 Ω的图形

参考文献

[1] Scott Smith. Drilling Square Holes[J]. The Mathematics Teacher, 1993(10) (Vol. 86,

No. 7).

http://upper.us.edu/faculty/smith/reuleaux.htm.

[2] http://en.wikipedia.org/wiki/Reuleaux_triangle.

14

Page 18: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

关于一个子群格所对应的群及其Galois理论

潘锦钊∗

1 问题以及问题背景

上学期我学习了肖杰老师开设的“抽象代数II”课程。课程的内容之一是Galois理

论。其中一个思考题比较有意思。本文希望通过这个思考题及其求解过程,向大家介绍一

下Galois理论及其应用。

问题1 找到一个有限群,使得该群拥有如图1所示的子群格,并且找到一个域

的Galois扩张,其Galois群为该群,并且找到每个子群对应的中间域。

G

图 1 一个子群格

2 Galois理论介绍

设K/F是域的代数扩张,若F上任一不可约多项式或者在K中无根,或者根都

在K中,则称K是F的正规扩张。设f ∈ F [x],若f的每个不可约因子(在f的分裂域中)均

∗基数83

15

Page 19: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

无重根,则称f是一个可分多项式。如果K中每个元素在F上的极小多项式都是可分多项

式,则称K是F的可分扩域。特别地,由于特征为0的域上所有不可约多项式都是可分多

项式,因此特征为0的域的有限扩张都是可分扩张。

设G是域K的一个自同构群,则K中在所有G中元素作用下均保持不动的元素全体构

成K的子域,称为G的固定域,记为KG := α ∈ K|φ(α) = α, ∀φ ∈ G。设K/F是域的代数扩张,则K的所有保持F中元素不动的自同构全体构成一个群,称为K/F的Galois群,

记为GalK/F := φ ∈ AutK|φ(α) = α,∀α ∈ F。若KGalK/F = F,则称K是F的Galois扩

域。有如下定理:

定理2 设K/F是域的代数扩张,则下列命题等价:

1. K/F是Galois扩张;

2. K/F是可分正规扩张;

3. K是F中(一族)可分多项式的分裂域;

若K/F是有限扩张,则这些命题还和|GalK/F | = [K : F ]等价。

若K是F的Galois扩域,则GalK/F的子群全体和K/F的中间域全体之间存在一一对

应关系。事实上,两者在群和域的包含关系下分别形成两个格,这两个格有反同构关系:

定理3 (Galois主定理) 设K是F的Galois扩域,G = GalK/F,Σ是G的子群全体,

Ω是K/F的中间域全体,φ : Σ → Ω,H 7→ KH,ψ : Ω → Σ, L 7→ GalK/L,则有:

1. φ和ψ是互逆双射;

2. H1 ⊃ H2当且仅当KH1 ⊂ KH2;

3. 若K/F是有限扩张,则有|H| = [K : KH ],[G : H] = [KH : F ];

4. H G当且仅当KH是F的正规扩域。而且这时有GalKH/F ∼= G/H。

3 问题的求解

3.1 一些记号和结论

以下用Cn表示n阶循环群,由于Cn∼= Z/nZ,因此当表示其中元素时我们一般写

为0, 1, · · · , n− 1。用Dn表示n阶二面体群(有2n个元素),用Sn表示n阶置换群(有n!个元

素),用An表示n阶交错群(有12n!个元素)。

设G是一个有限群,p是一个素数,若pm是整除|G|的最大p的幂次(m > 0),则

称G的pm阶子群为G的p-Sylow子群。以下我们要经常使用Sylow定理:

16

Page 20: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

定理4 (Sylow定理) 设G是一个有限群,p是一个素数,使得|G| = pmn,其中m,n ∈Z+, p - n。则有:

1. G必有pk阶子群,k = 1, 2, · · · ,m;

2. G的任意两个p-Sylow子群都共轭;

3. G的p-Sylow子群个数r为n的因子,且r ≡ 1(mod p);

4. G的任一pk阶子群都包含在某个G的p-Sylow子群内。

3.2 群的确定

首先有一个平凡的结论:

命题5 如果一个有限群G没有真子群,即它的子群只有1和它自己,则G是平凡群或者素数阶循环群。

J 由于∀x ∈ G, ⟨x⟩ ⊂ G,因此若x = 1则必有⟨x⟩ = G成立,即G是循环群。因

此G有任意|G|的因数阶的子群。因此|G|不是合数,得证。 I

因此图1中与1直接相连的顶点一定是素数阶循环群。我们注意到图1中有一些子群(见图3),它的子群格与图2完全一样。

1

H

G

H H1 2 3

图 2

命题6 子群格为图2所示的有限群只能是Klein四元群。

J 有3种情况:

1. H1∼= Cp,H2

∼= Cq,H3∼= Cr, p, q, r为互不相同的素数。这时有pqr

∣∣|G|。根据Sylow定

理,|G|的素因子只有p, q, r,否则G有一个阶数不同于p, q, r的Sylow子群,发生矛

盾。设|G| = pαqβrγ,则必有α = β = γ = 1,否则不妨设α > 2,则G有一个p-

Sylow子群,其阶数为pα,矛盾。故|G| = pqr。由于G的p, q, r-Sylow子群都只有一

个,故得H1,H2,H3均为G的正规子群,故G/H1的所有子群对应于G和H1的中间子

17

Page 21: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

群。但是|G/H1| = qr,根据Sylow定理其必有q, r阶子群,因此得到G必有pq, pr阶子

群,矛盾。故该情况不可能。

2. H1∼= Cp,H2

∼= H3∼= Cq, p, q为互不相同的素数。这时有pq

∣∣|G|。同样根据Sylow定

理,|G|的素因子只有p, q,而且|G| = pq。由于q-Sylow子群恰有2个,根据Sylow定

理有2 ≡ 1 (mod q)成立,故q|1,不可能。故该情况不可能。

3. H1∼= H2

∼= H3∼= Cp为素数阶循环群。根据Sylow定理,|G|的素因子只有p,因

此|G| = pα。α > 1,否则G没有真子群。如果α > 3,则G必有p2阶子群,矛盾。

因此只能有α = 2成立,|G|为p2阶群,必为交换群1,而且只有两种,Cp2和C2p =

Cp × Cp。如果G是Cp2 = 0, 1, · · · , p2 − 1,则其所有子群均为循环群,只有一个p阶子群⟨p⟩,矛盾。如果G是C2

p,则其p阶子群为循环群,由C2p中一个元素生成。

设(a, b) ∈ C2p , a, b ∈ Cp = 0, 1, · · · , p− 1,只要a, b不全为0,则(a, b)都是p阶元,

生成一个子群同构于Cp。而Cp除了单位元之外共有p − 1个元素,因此得到C2p中共

有p2−1p−1 = p+ 1个不同的p阶群。故p+ 1 = 3,得到p = 2,G ∼= C2

2是Klein四元群。

综上所述,子群格为图2所示的有限群只能是Klein四元群。 I

于是我们确定图1中的一部分子群,如图3所示。

图 3

我们再考虑如图4所示的子群格。

命题7 子群格为图4所示的有限群只能是S3。

1根据有限群的类方程,|G| = |C|+∑y [G : C(y)],其中y跑遍G的多于1个元素的共轭类。这时C(y) = G,

只能有[G : C(y)] = p成立。因此p∣∣|C|,|C| = p或p2。若|C| = p,则设y ∈ G\C,有C ⊂ C(y), y ∈ C(y),

因此|C(y)| > p + 1,只能有C(y) = G,故y ∈ C,矛盾。因此|C| = p2,C = G,因此G是交换群。

18

Page 22: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

1

G

图 4

J 有两种情况。如果p = 2,则由前面知G ∼= C22,并没有4个2阶子群,矛盾。如

果p = 2,则同样根据Sylow定理,|G|的素因子只有2, p,而且|G| = 2p。因此C2就是G的2-

Sylow子群,共有3个,于是3|p,因此p = 3成立,|G| = 6。这时G有3阶元,设其中一个

为a,还有2阶元,设其中一个为b。则C3∼= ⟨a⟩ G,因为[G : ⟨a⟩] = 2。故G = ⟨a⟩ ∪ b⟨a⟩,

且b−1ab ∈ ⟨a⟩,故可设b−1ab = an。n = 0。若n = 1,则ab = ba,G = C2 × C3∼= C6,

只有1个2阶子群,不满足条件。若n = 2,则ab = ba2,设a = (123), b = (12),则得

到G ∼= S3,有3个2阶子群,满足条件。于是必有p = 3,G ∼= S3成立。 I

于是得到图5。

图 5

我们再考虑如图6所示的子群格。

命题8 子群格为图6所示的有限群只能是D4。

J 先考虑子群H的类型。 |H|的素因子只有2,否则其有一个非2阶的p-Sylow子群。

设|H| = 2k,只能k = 2, |H| = 4,否则若k > 3,则H有22 = 4阶真子群,矛盾。于

是H ∼= C22或C4。但是C

22有3个2阶子群,而C4恰有1个2阶子群。故有H ∼= C4成立。

同样|G|的素因子只有2,设|G| = 2n,同样得出只能n = 3, |G| = 8,否则G有一个8阶

的真子群,矛盾。于是由[G : H] = 2得到H G。设H = ⟨a⟩。由于C22 ⊂ G,其有3个2阶

19

Page 23: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

1

G

H

图 6

元,而H只有1个,故G中至少有一个2阶元不属于H,设其中一个为b,则G = ⟨a⟩ ∪ b⟨a⟩,且b−1ab ∈ ⟨a⟩,故可设b−1ab = an。n = 0。若n = 1,则ab = ba,G = C2 × C4,只

有3个2阶子群,不满足条件。若n = 2,则b−1ab = a2, (b−1ab)2 = b−1a2b = a4 = 1,得

到a2 = bb−1 = 1,与a是4阶元矛盾。若n = 3,则ab = ba3 = ba−1,于是得到G ∼= D4成

立,经验证D4确实有如图6所示的子群格。 I

于是我们得到图7。

G

H

图 7

只剩下子群H和整个群G的结构未确定了。考虑它们的阶数,其素因子只有2,3,否

则它们有一个p-Sylow子群,p = 2, 3,矛盾。而且|H| = 12,否则H有8阶子群或9阶子群;

|G| = 24,否则G有16阶子群或9阶子群。

命题9 H ∼= A4。

J H的2-Sylow子群只有一个V ∼= C22,故为正规子群,且H/V

∼= C3。设V =

⟨a, b⟩ = 1, a, b, ab。H还有4个3-Sylow子群,均为C3,设其中一个为⟨h⟩。则h和h2的

阶数均为3,因此h, h2 /∈ V,故V, hV, h2V两两不交,于是有H = V ∪ hV ∪ h2V成立。

由V为正规子群知h−1V h = V,故φ : V → V, v 7→ h−1vh为双射,而且是群同态,因此

20

Page 24: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

为V的自同构。由于h3 = 1,故φ3(v) = φφφ(v) = h−3vh3 = v,故φ3 = 1成立。又V的

自同构保持1不变,只改变a, b, ab中元素的值,因此φ可以看成S3中的元素。S3中满足三

次幂为1的元素只有3个:1,(123)和(132),因此φ有3种情况:

1. φ为恒等映射。这时得到∀v ∈ V, vh = hv,于是得到H ∼= C22 × C3。这时H有6阶子

群,矛盾。

2. φ(a) = b, φ(b) = ab, φ(ab) = a,即ah = hb, bh = hab, abh = ha。设a = (12)(34), b =

(13)(24), h = (234),则满足前面条件,而且得到H ∼= A4成立。

3. φ(a) = ab, φ(b) = a, φ(ab) = b,即ah = hab, bh = ha, abh = hb。只需要把前面

的a, b调换一下,即a = (13)(24), b = (12)(34), h = (234),则满足前面条件,而且得

到H ∼= A4成立。

综上所述,我们有H ∼= A4成立。 I

引理10 AutA4∼= S4,而且ψ : S4 → AutA4, g 7→ σg, σg(a) = gag−1是同构映射。

J 有A4 = ⟨(123), (12)(34)⟩,因此对任意φ ∈ AutA4,φ由其在(123)和(12)(34)的值

确定。由于φ是自同构,故φ((123)

)和φ

((12)(34)

)分别是A4中的3阶元和2阶元。而A4中

有8个3阶元,3个2阶元,因此有|AutA4| 6 3 · 8 = 24成立。当a ∈ A4时a是偶置换,

gag−1也是偶置换,仍在A4中。故σg是A4到自身的双射,且是群同态,因此是A4的自

同构。故ψ的定义合理。∀g, h ∈ S4, a ∈ A4,有σg σh(a) = σg(hah−1) = ghah−1g−1 =

σgh(a),因此ψ是群同态。若g ∈ S4使得σg = id成立,则有σg

((123)

)= g(123)g−1 =

(g−1(1) g−1(2) g−1(3)

)= (123)成立。因此g−1(1), g−1(2), g−1(3)均不等于4,故g−1(4) =

4,即g保持4不动。将(123)换成(124), (134)和(234),类似地得到g也保持1,2,3不动,于是

有g = 1成立。因此得到ψ是单射,又|S4| = 24, |AutA4| 6 24,因此得到ψ也是满射。因

此ψ是群同构,故AutA4∼= S4成立。 I

下面考虑G的结构。

命题11 G ∼= S4。

J 有[G : H] = 2,故H G成立。H ∼= A4中只有3个2阶元,而D4 ⊂ G中有5个2阶

元,因此G\H中必有2阶元,设为g,有G = H ∪ gH,且g−1Hg = H成立。故与前面类似

可得φ : H → H, a 7→ g−1ag是H ∼= A4的自同构,且φ2 = 1成立。

下面考虑φ作为AutA4∼= S4的元素,并且满足φ

2 = 1。故ψ−1(φ) ∈ S4满

足(ψ−1(φ)

)2= 1,有如下的情况:

21

Page 25: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

1. ψ−1(φ) = 1。这时φ = σ1,即∀a ∈ A4, φ(a) = g−1ag = a成立,即ag = ga成立。故

得到G ∼= A4 × C2。但是D4 ⊂ G中有4阶元,而A4 × C2中没有4阶元,矛盾。

2. ψ−1(φ)是S4中的22型2阶元,设为(i1i2)(i3i4)。考虑G中2阶元的个数。由于G中

一个2阶元和单位元构成G的2阶子群,故根据G有9个不同的2阶子群知G中

有9个2阶元。而G = H ∪ gH,H ∼= A4中有3个2阶元。由于单位元1 /∈ gH,

因此若gh ∈ gH是2阶元,当且仅当1 = (gh)2 = ghgh = g−1hgh = φ(h)h,

其中h ∈ H。设h = (j1j2j3)为H中3阶元, j4为1, 2, 3, 4中不同于j1, j2, j3的元素,则h保持j4不动。有φ(h) =

((ψ−1(φ))−1(j1) (ψ−1(φ))−1(j2) (ψ−1(φ))−1(j3)

),

故φ(h)保持(ψ−1(φ))−1(j4)不动。而ψ−1(φ) = (i1i2)(i3i4)在1, 2, 3, 4上的作用是

可迁的,于是j4 = (ψ−1(φ))−1(j4),故φ(h)(j4) = j4,于是(φ(h)h

)(j4) = j4,

故φ(h)h = 1成立。即若h是H中的3阶元,则gh不是2阶元。H中有8个3阶元,于

是gH中至少有8个不是2阶元,至多有4个2阶元。于是得到G中至多有3+4 = 7个2阶

元,与G中有9个2阶元矛盾。

3. ψ−1(φ)是S4中的1221型2阶元,设为(i1i2)。这时设η : G → S4,∀h ∈ H ∼=A4, η(h) = h, η(gh) = (i1i2)h,则∀h1, h2 ∈ H ∼= S4,有η(h1h2) = η(h1)η(h2),

η(gh1 ·h2) = (i1i2)h1h2 = η(gh1)η(h2),η(h1 ·gh2) = η(gφ(h1)h2) = (i1i2)φ(h1)h2 =

h1(i1i2)h2 = η(h1)η(gh2),η(gh1 ·gh2) = η(φ(h1)h2) = φ(h1)h2 = (i1i2)h1(i1i2)h2 =

η(gh1)η(gh2),故η是群同态。由于S4中的任意一个偶置换在H ∼= A4中,任意一个

奇置换乘上(i1i2)之后变为一个偶置换,于是奇置换必在η(gH)中。于是η是满同态,

而|G| = |S4| = 24,故η也是单同态,于是为同构,故G ∼= S4成立。

另一方面,S4的子群格确实有如图1所示的结构(见图8)。综上所述,G ∼= S4。 I

因此图1所示子群格所对应的有限群是唯一的。

3.3 S4作为一般系数四次方程的Galois群

设F是数域,s1, s2, s3, s4是不定元,K = F (s1, s2, s3, s4)。设f(x) = x4 − s1x3 +

s2x2 − s3x + s4 ∈ K[x],则其为K上的不可约多项式。设其4个根为u1, u2, u3, u4,E =

F (u1, u2, u3, u4),则E是f在K上的分裂域,因此是K的Galois扩域。考虑G = GalE/K。

命题12 G ∼= S4。

J 设σ ∈ G,则σ完全由其在u1, u2, u3, u4上的取值决定。由于σ(ui)仍然是f的根,

i = 1, 2, 3, 4,因此σ(u1, u2, u3, u4) = u1, u2, u3, u4,故σ可以看成S4中的元素。因

此G ⊂ S4, |G| 6 |S4| = 24。另一方面,根据韦达定理,s1 = u1 + u2 + u3 + u4,

22

Page 26: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

图 8 S4的子群格,以及每个子群的表达式。

s2 =∑

16i<j64 uiuj = u1u2 + u1u3 + u1u4 + u2u3 + u2u4 + u3u4,s3 = u1u2u3 + u1u2u4 +

u1u3u4 +u2u3u4,s4 = u1u2u3u4。将S4中元素看成E中置换u1, u2, u3, u4所得到的自同构,

则有s1, s2, s3, s4 ∈ ES4成立。故K ⊂ ES4,G ⊃ GalE/ES4 = S4,于是|G| > |S4| = 24成

立。综上所述,有|G| = |S4| = 24,G ∼= S4成立。 I

因此S4可以看成一般系数四次方程的Galois群。

3.4 一般系数四次多项式的分裂域的与S4各子群对应的中间域的计算

先考虑A4 S4对应的中间域。我们先定义D =∏

16i<j64 (ui − uj)2,即四次方程的

判别式。有D ∈ K。

命题13 EA4 = K(δ),其中δ =√D =

∏16i<j64 (ui − uj)。

J 有EA4/K是Galois扩域,且[EA4 : K] = [S4 : A4] = 2,Gal(EA4/K) ∼= S4/A4∼=

C2。有D在S4作用下不变,δ在A4作用下不变,但在S4作用下改变。因此D ∈ K,而

且δ ∈ EA4但δ /∈ K。因此有EA4 = K(δ) = K(√D)。 I

考虑V = 1, (12)(34), (13)(24), (14)(23) A4对应的中间域。

命题14 EV = EA4(β1, β2, β3) = EA4(βi),∀i = 1, 2, 3,其中β1 = (u1 + u2)(u3 + u4),

β2 = (u1 + u3)(u2 + u4),β3 = (u1 + u4)(u2 + u3)。

23

Page 27: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

J 有EV /EA4是Galois扩域,且[EV : EA4 ] = [A4 : V ] = 3,Gal(EV /EA4) ∼=A4/V ∼= C3。有βi在V作用下不变,但是在A4作用下改变,故βi ∈ EV , βi /∈ EA4。而

且A4β1 = β1, β2, β3,对β2, β3也同样,即A4在β1, β2, β3上面的作用是可迁的。而且对于任意σ ∈ S4,有σ

(β1, β2, β3

)= β1, β2, β3成立。于是我们考虑(x − β1)(x −

β2)(x− β3),则其在S4作用下不变,因此其为K ⊂ EA4中的3次多项式,而且是EA4中(从

而也是K中)的不可约多项式。 2 EV包含其3个根,因此为其在EA4上的分裂域。考

虑EA4(βi)为EV和EA4的中间域,有[EA4(βi) : EA4 ] = 3,且[EV : EA4 ] = 3成立。于

是有EV = EA4(β1, β2, β3) = EA4(β1) = EA4(β2) = EA4(β3)成立。 I

由于Gal(EV /EA4) ∼= C3,因此EV是EA4的循环扩张,我们希望其能用EA4中元素以

及根式显式表达。

命题15 β1, β2, β3可以用EA4中元素,

√−3通过有限次四则运算和立方根表示出来。

J 设ω = e2πi3 = −1

2 +√−3

2 为三次本原单位根,γ0 = β1 + β2 + β3 = 2s2,γ1 =

β1 + ωβ2 + ω2β3,γ2 = β1 + ω2β2 + ωβ3,则β1, β2, β3可以用γ0, γ1, γ2在Q(√

−3)中线性表

出。有

γ31 + γ3

2 = 2(β31 + β3

2 + β33) − 3(β2

1β2 + β1β22 + β2

2β3 + β2β23 + β2

3β1 + β3β21) + 12β1β2β3

= 9s1s2s3 − 2s32 − 27s23 − 27s21s4 + 72s2s4,

γ31 − γ3

2 = 3√

−3(β21β2 − β1β

22 + β2

2β3 − β2β23 + β2

3β1 − β3β21)

= −3√

−3δ

于是

γ1,2 =3

√1

2(9s1s2s3 − 2s32 − 27s23 − 27s21s4 + 72s2s4 ∓ 3

√−3δ)

即γ1, γ2可以用EA4中元素,

√−3通过有限次四则运算和立方根表出。因此命题成立。

I

如 果√

−3 ∈ F,则β1, β2, β3可 以 用γ0, γ1, γ2在F中 线 性 表 出。这 时EV =

EA4(β1, β2, β3) = EA4(γ1, γ2)成立。

考虑V的3个2阶子群对应的中间域。它们都是V的指数为2的正规子群。

命题16 E⟨(12)(34)⟩ = EV (u1 +u2, u3 +u4) = EV (ε1),E⟨(13)(24)⟩ = EV (u1 +u3, u2 +

u4) = EV (ε2),E⟨(14)(23)⟩ = EV (u1 + u4, u2 + u3) = EV (ε3)成立。其中ε1 =

√s21 − 4β1 =

u1+u2−u3−u4,ε2 =√s21 − 4β2 = u1−u2+u3−u4,ε3 =

√s21 − 4β3 = u1−u2−u3+u4。

2事实上可以算得(x − β1)(x − β2)(x − β3) = x3 − 2s2x2 + (s2

2 + s1s3 − 4s4)x + s21s4 − s1s2s3 + s2

3。此三

次多项式即为四次方程的预解式。

24

Page 28: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

J 先看E⟨(12)(34)⟩,它是EV的2次扩张。考虑u1 + u2和u3 + u4。它们在(12)(34)作

用下保持不变,而在V另外两个非单位元作用下改变。因此两者都在E⟨(12)(34)⟩内,而

不在EV内。两者乘积为β1在EV内,因此只要添加其中一个元素到EV,则两个元素

都在扩域内。故E⟨(12)(34)⟩ = EV (u1 + u2, u3 + u4) = EV (u1 + u2)。进一步地,我们

有(u1+u2)+(u3+u4) = s1, (u1+u2)(u3+u4) = β1,故u1+u2和u3+u4是方程x2−s1x+β1的

根,故u1 + u2, u3 + u4 = 12(s1 ±

√s21 − 4β1) = 1

2(s1 ± ε1)。因此E⟨(12)(34)⟩ = EV (ε1)成立。

对另外两个中间域同理。 I

考虑E是前面3个中间域中任意一个的2次扩域。

命题17 有如下等式成立:

E = E⟨(12)(34)⟩(ε2) = E⟨(12)(34)⟩(ε3)

= E⟨(13)(24)⟩(ε1) = E⟨(13)(24)⟩(ε3)

= E⟨(14)(23)⟩(ε1) = E⟨(14)(23)⟩(ε2)

J 先看E作为E⟨(12)(34)⟩的扩域。如果我们添加ε2和ε3到E⟨(12)(34)⟩中,则由前面

知u1+u3, u2+u4, u1+u4, u2+u3都在扩域中,于是u1, u2, u3, u4都在扩域中,此扩域即为E。

另外由于∏3

i=1(s21−4βi) = (s31−4s1s2+8s3)

2是K中元素的平方,于是只要添加ε2和ε3中的

一个元素,则另一个元素也在扩域中。于是我们有E = E⟨(12)(34)⟩(ε2) = E⟨(12)(34)⟩(ε3)成

立。对另外两个中间域同理。 I

到现在为止,我们实际上已经证明了一般系数四次方程存在求根公式。

命题18 u1, u2, u3, u4可以用K中元素通过有限次四则运算、平方根和立方根表示出

来。

J 根据命题13,命题15和命题16,任意ui + uj , i = j都可以用K中元素通过有限次

四则运算、平方根和立方根表出。因此u1, u2, u3, u4也可以。 I

下面考虑S4的3个同构于D4的子群所对应的中间域。

命题19 E⟨(1324),(12)⟩ = K(β1),E⟨(1234),(13)⟩ = K(β2),E

⟨(1243),(14)⟩ = K(β3)成立。

J 先看E⟨(1324),(12)⟩。我们注意到此群作用在β1 = (u1 + u2)(u3 + u4)上面保持其不

变。因此β1 ∈ E⟨(1324),(12)⟩。又[E⟨(1324),(12)⟩ : K] = 3,由前面知道β1是K中不可约多项式

的根,因此[K(β1) : K] = 3,故有E⟨(1324),(12)⟩ = K(β1) = K((u1 +u2)(u3 +u4)

)成立。另

外两个中间域同理可证。 I

25

Page 29: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

考虑S4中3个同构于C4的子群所对应的中间域。这3个群分别是一个D4的指数为2的

正规子群。因此C4对应的中间域分别是D4对应的中间域的2次扩域。先考虑E⟨(1324)⟩ ⊃E⟨(1324),(12)⟩ = K(β1)。为了确定这两个域的关系,我们要找一个元素在⟨(1324)⟩作用下保持不变,而在(12)作用下改变。那么这个元素就属于E⟨(1324)⟩\K(β1)。这个元素必定能

用K(β1)上面元素和平方根表示出来。我们很容易想到可以取ξ1 = u21u3 + u2

3u2 + u22u4 +

u24u1,不过这样计算比较繁杂

3,而且计算结果不够直观。

事实上4,我们可以考虑√

(s21 − 4β1)D = ε1δ = (u1 +u2 −u3 −u4)∏

16i<j64(ui −uj),

它具有我们想要的性质。

命题20 有下列等式成立:

E⟨(1324)⟩ = K(β1,√

(s21 − 4β1)D)

E⟨(1234)⟩ = K(β2,√

(s21 − 4β2)D)

E⟨(1243)⟩ = K(β3,√

(s21 − 4β3)D)

J 可以知道ε1δ在⟨(1324)⟩作用下保持不变,而在(12)作用下反号。因此其

在E⟨(1324)⟩而不在E⟨(1324),(12)⟩ = K(β1)中。而其平方为(s21 − 4β1)D ∈ K(β1)。因此我

们得到E⟨(1324)⟩ = E⟨(1324),(12)⟩(ε1√D) = K(β1,

√(s21 − 4β1)D)成立。对另外两个中间域

同理。 I

S4中3个同构于D4的子群各有两个同构于C22的指数为2的子群。其中一个子群V是它

们公共的,另外一个则是三者独立的。考虑这些群所对应的中间域在D4对应的中间域上

的扩张方式。

命题21 有下列等式成立:

E⟨(12),(34)⟩ = K(u1 + u2) = K(u3 + u4) = E⟨(1324),(12)⟩(ε1)

E⟨(13),(24)⟩ = K(u1 + u3) = K(u2 + u4) = E⟨(1234),(14)⟩(ε2)

E⟨(14),(23)⟩ = K(u1 + u4) = K(u2 + u3) = E⟨(1243),(14)⟩(ε3)

而且EV是任意一个D4对应的中间域添加δ =√D得到的扩域。

3ξ1在(12)作用下变为ζ1 = u1u23 + u3u

22 + u2u

24 + u4u

21,因此D4ξ1 = ξ1, ζ1,而且D4ξ1, ζ1 = ξ1, ζ1。

因此ξ1 + ζ1和ξ1ζ1在D4作用下不变,都是K(β1)中的元素。事实上,可以算得ξ1 + ζ1 = s1β1 − 2s3,ξ1ζ1 =

s31s3 − 4s1s2s3 + 5s2

3 − s21s2β1 + 4s2

2β1 − s1s3β1 + s21β

21 − 4s2β

21 + β3

1。因此(ξ1 − ζ1)2 = (ξ1 + ζ1)

2 −4ξ1ζ1是一个关于β1的K中的多项式,记为ξ(β1)。于是E⟨(1324)⟩ = K(β1, ξ1, ζ1) = K(β1, ξ1) = K(β1, ζ1) =

K(β1,√

ξ(β1))成立。同理可定义ξ2 = u21u2 + u2

2u3 + u23u4 + u2

4u1, ξ3 = u21u2 + u2

2u4 + u24u3 + u2

3u1,得到

另外两个中间域的结果。4根据朱艺航同学的建议。

26

Page 30: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

J 有u1 +u2, u3 +u4在⟨(12), (34)⟩作用下保持不动,而在⟨(1324), (12)⟩的其它元素作用下,两者互换位置。因此E⟨(12),(34)⟩ = E⟨(1324),(12)⟩(u1 + u2, u3 + u4) = K(u1 + u2) =

K(u3 + u4)。由前面知道u1 + u2, u3 + u4是x2 − s1x+ β1的根,可由ε1 =

√s21 − 4β1表出,

故有E⟨(12),(34)⟩ = E⟨(1324),(12)⟩(ε1)。对另外两个中间域同理。

由命题14知道EV = K(δ, βi),因此是任意一个D4对应的中间域添加δ得到的扩域。

I

V有3个2阶子群,它们的每一个分别是C4和另一个C22的指数为2的子群。例

如⟨(12)(34)⟩是⟨(1324)⟩以及⟨(12), (34)⟩的子群。我们考虑这些群所对应中间域之间的扩张方式。

命题22 有下列等式成立:

E⟨(12)(34)⟩ = E⟨(1324)⟩(ε1) = E⟨(1324)⟩(√D) = E⟨(12),(34)⟩(

√D)

E⟨(13)(24)⟩ = E⟨(1234)⟩(ε2) = E⟨(1234)⟩(√D) = E⟨(13),(24)⟩(

√D)

E⟨(14)(23)⟩ = E⟨(1243)⟩(ε3) = E⟨(1243)⟩(√D) = E⟨(14),(23)⟩(

√D)

J 先考虑⟨(12)(34)⟩所对应的中间域。有u1 + u2, u3 + u4在⟨(12)(34)⟩作用下不动,在⟨(1324)⟩的其它元素作用下互换位置。因此与前面类似,得到E⟨(12)(34)⟩ = E⟨(1324)⟩(ε1)。

又有δ =√D在⟨(12)(34)⟩作用下不动,在⟨(12), (34)⟩和⟨(1324)⟩的其它元素作用下反号。

因此有E⟨(12)(34)⟩ = E⟨(1324)⟩(√D) = E⟨(12),(34)⟩(

√D)成立。同理可得其余等式。 I

S4子群⟨(ij)⟩为⟨(ij), (kl)⟩的指数为2的子群,其中i, j, k, l是1, 2, 3, 4的一个排列。考虑

这2个群所对应中间域之间的扩张方式。

命 题23 设i, j, k, l是1, 2, 3, 4的 一 个 排 列,则 有E⟨(ij)⟩ = E⟨(ij),(kl)⟩(uk, ul) =

K(uk, ul)成立。而且uk, ul是E⟨(ij),(kl)⟩ = K(ui + uj)中一个二次多项式的根。因

此E⟨(ij)⟩是E⟨(ij),(kl)⟩的二次扩域。

J 考虑⟨(ij)⟩作为⟨(ij), (kl)⟩的指数为2的子群所对应的中间域。有uk, ul在(ij)作用

下不变,在⟨(ij), (kl)⟩其它元素作用下互换位置。因此添加这两个元素(之一)即得到扩域。

又有uk + ul和ukul在⟨(ij), (kl)⟩作用下保持不变,因此它们在E⟨(ij),(kl)⟩ = K(ui + uj)中,

因此uk, ul是K(ui + uj)中一个二次多项式的根。于是命题成立。 I

考虑E作为E⟨(ij)⟩ = K(uk, ul)的二次扩域,其中i, j, k, l是1, 2, 3, 4的一个排列。

命题24 E = E⟨(ij)⟩(ui, uj)。另外ui, uj是E⟨(ij)⟩上一个二次方程的根,因此E可以通

过E⟨(ij)⟩添加其中一个元素的平方根来实现。

27

Page 31: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

J 显然E = K(uk, ul)(ui, uj) = E⟨(ij)⟩(ui, uj)成立。另一方面,有ui + uj =

s1 − uk − ul ∈ K(uk, ul),uiuj = s2 − (uk + ul)(s1 − uk − ul) − ukul ∈ K(uk, ul)。

故ui, uj是E⟨(ij)⟩ = K(uk, ul)中二次方程的根。故有E = E⟨(ij)⟩(ui, uj) = E⟨(ij)⟩(ui −uj) =

E⟨(ij)⟩(√

(ui + uj)2 − 4uiuj)成立。 I

考虑S4同构于S3的4个子群所对应的中间域。

命题25 有下列等式成立:

E⟨(12),(13)⟩ = K(u4), E⟨(12),(14)⟩ = K(u3),

E⟨(13),(14)⟩ = K(u2), E⟨(23),(24)⟩ = K(u1).

J 先看E⟨(12),(13)⟩。有u4在此群作用下保持不动,因此u4是中间域中元素。又此中

间域是4次扩域,且u4是K中4次不可约多项式的根,故有E⟨(12),(13)⟩ = K(u4)成立。另外

三个同理可证。 I

考虑S3的3个2阶子群所对应的中间域。

命题26 有下列等式成立:

E⟨(12)⟩ = E⟨(12),(13)⟩(β1), E⟨(13)⟩ = E⟨(12),(13)⟩(β2), E

⟨(23)⟩ = E⟨(12),(13)⟩(β3),

E⟨(12)⟩ = E⟨(12),(14)⟩(β1), E⟨(24)⟩ = E⟨(12),(14)⟩(β2), E

⟨(14)⟩ = E⟨(12),(14)⟩(β3),

E⟨(34)⟩ = E⟨(13),(14)⟩(β1), E⟨(13)⟩ = E⟨(13),(14)⟩(β2), E

⟨(14)⟩ = E⟨(13),(14)⟩(β3),

E⟨(34)⟩ = E⟨(23),(24)⟩(β1), E⟨(24)⟩ = E⟨(23),(24)⟩(β2), E

⟨(23)⟩ = E⟨(23),(24)⟩(β3).

J 先看E⟨(12)⟩ ⊃ E⟨(12),(13)⟩。由前面知β1 ∈ E⟨(12)⟩,而⟨(12), (13)⟩β1 = β1, β2, β3,因此β1 /∈ E⟨(12),(13)⟩,且(x − β1)(x − β2)(x − β3) ∈ K[x]在E⟨(12),(13)⟩中仍然不可约。

又由于[E⟨(12)⟩ : E⟨(12),(13)⟩] = 3,故有E⟨(12)⟩ = E⟨(12),(13)⟩(β1)成立。同理有E⟨(13)⟩ =

E⟨(12),(13)⟩(β2),E⟨(23)⟩ = E⟨(12),(13)⟩(β3)成立。同理可得其余等式。 I

考虑C3作为S3和A4的子群所对应的中间域。

命题27 有下列等式成立:

E⟨(123)⟩ = E⟨(12),(13)⟩(√D) = EA4(u4) = K(u4,

√D)

E⟨(124)⟩ = E⟨(12),(14)⟩(√D) = EA4(u3) = K(u3,

√D)

E⟨(134)⟩ = E⟨(13),(14)⟩(√D) = EA4(u2) = K(u2,

√D)

E⟨(234)⟩ = E⟨(23),(24)⟩(√D) = EA4(u1) = K(u1,

√D)

28

Page 32: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

J 先看E⟨(123)⟩ ⊃ E⟨(12),(13)⟩ = K(u4)。此为二次扩域。有δ =√D在⟨(123)⟩ ⊂

A4作用下保持不动,而在⟨(12), (13)⟩其它元素作用下反号。 因此有E⟨(123)⟩ =

E⟨(12),(13)⟩(√D) = K(u4,

√D)成立。又由于EA4 = K(

√D),因此E⟨(123)⟩ = EA4(u4)成

立。同理可得其余等式。 I

最后考虑E作为EC3的3次扩域,其中C3为S4中任意的3阶循环群。

命题28 E是任意一个C3所对应中间域添加任意一个βi所得到的3次扩域。

J 先看E ⊃ E⟨(123)⟩。有⟨(123)⟩βi = β1, β2, β3对所有i = 1, 2, 3成立。因此βi均

不在E⟨(123)⟩中,且(x − β1)(x − β2)(x − β3) ∈ K[x]在E⟨(123)⟩中仍然不可约。于是

有E = E⟨(123)⟩(βi),∀i = 1, 2, 3成立。同样地,有E = E⟨(124)⟩(βi) = E⟨(134)⟩(βi) =

E⟨(234)⟩(βi),∀i = 1, 2, 3成立。 I

到此为止我们把E和K的所有中间域及其关系找出来了。综合上面的内容,对应

于S4的子群格,我们给出一个图,表现出E和K的所有中间域及其关系,如图9。

图 9 S4作为E/K的Galois群,其每个子群对应的中间域及其关系(注意与图8比较)。

3.5 S4作为有理系数四次方程的Galois群

设 F = Q , f ∈ F [x] 是4次不可约多项式,u1, u2, u3, u4 是其4个根,E =

29

Page 33: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

F (u1, u2, u3, u4)是其分裂域,则E/F是Galois扩域。乘开可得f(x) = x4 − s1x3 + s2x

2 −s3x + s4成立。对任意σ ∈ GalE/F,根据命题12,可以看成σ ∈ S4成立。故GalE/F ⊂S4成立。由于f不可约,故GalE/F在u1, u2, u3, u4上的作用是可迁的。有S4的可迁子

群5是S4, A4, D4, C4或V。

命题29 假设f的判别式D不是F中元素的完全平方,即δ =√D /∈ F。而且(x −

β1)(x − β2)(x − β3) ∈ F [x]是F中的不可约多项式。则有GalE/F ∼= S4成立。因此E/F的

中间域结构与上一节所得结果一样。

J 有F (β1, β2, β3) ⊂ E也是F的Galois扩域,因此GalF (β1, β2, β3)/F是GalE/F的一

个商群,而且也是S3的可迁子群。S3的可迁子群只能是S3或C3,阶数都是3的倍数。

若GalE/F ∼= D4, C4或V,则其阶数都不是3的倍数,不可能有一个商群阶数是3的倍

数,矛盾。因此GalE/F ∼= S4或A4。如果GalE/F ∼= A4,则由于δ =∏

16i<j64(ui −uj)在GalE/F ∼= A4作用下保持不动,因此得到δ ∈ EGalE/F = F成立,与假设矛盾。因此

在假设下必有GalE/F ∼= S4成立。 I

考虑一个例子:f(x) = x4 − 2x+ 2,这时s1 = s2 = 0, s3 = s4 = 2。根据Eisenstein判

别法,知道f在Q上不可约。可以算得D = 1616不是完全平方。可以算得(x − β1)(x −β2)(x − β3) = x3 − 8x + 4,如果其有有理根则必为±1,±2,±4之一。而这些数均不是它

的根,因此其在Q上没有一次因子,故其在Q上不可约。因此设E是其在Q上的分裂域,则GalE/Q ∼= S4成立。

参考文献

[1] 姚慕生,抽象代数学(第2版)。上海:复旦大学出版社,2009。

[2] Michael Artin, 代数。北京:机械工业出版社,2009。

5[2]第十四章,第六节。

30

Page 34: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

S2上不存在非零连续切向量场的一个分析证明

苏桃∗

1 引言

本文将给出如下拓扑学中如下一个熟悉结论的证明:

命题1. S2上不存在非零连续切向量场。

我首先看到这个结论是在[1]中 Page 161, 3c)看到,当时这个结果在一道习题中被作为事

实而要求由此推出另一个结论。它由此引起了我的兴趣,很遗憾当时并没有学拓扑学,不

知道从拓扑学的角度去考虑,不过当时正学了微分方程,而我惊奇地发现这一命题有可能

从微分方程的方法得出,下面是我的一些粗略想法:

基本思想是在S2上考虑微分方程:

dy

dt= f(y), y ∈ S2 (1)

在S2上,先考虑f光滑,我们应该可以得到两两不交的解曲线,直观想像应该有一种特殊

的闭曲线(以后称闭轨)。那么,我们在这条闭轨围成的一个区域中还有一堆解曲线,因

此应该还有一条“更小”的闭轨,如此下去,那我们有可能找到一列闭轨,它们不断收

缩,直观上看,很可能收缩为一点。很明显,该点处不可能有非零切向量,因为在它周围

有闭轨绕它转了一圈,从而切向量的方向也绕了一圈。我们得到了一个矛盾。这样,我们

“证明”了命题1。

然而,作为一个严格的论述,我们还有必要实现所有的细节。

2 S2上的微分方程

我们将先考虑f光滑的情形。在S2上同样可以考虑微分方程并建立解的存在性、唯一

性、最大存在区间等一系列命题,这在文[7]中可以找到。为突出本文主题,我们将不细

∗基数81

31

Page 35: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

述,而仅指出给定初值的方程(1)存在唯一解,光滑,解的最大存在区间为R,且解曲线两两

不交。

引理1. 设y(t)为S2上方程(1)的一条解曲线,V为S2上的任一开集,则存在一点y ∈ V与解

曲线不交。

证明. 设y(t)定义在开区间I上,可不妨设V = S2,从而存在y0 ∈ S2 \ V。反之,假设

引理1不成立,可作球极投影φ : S2 \ y0 → R2,并可设φ(V )为平面上开圆盘D,由假设

知:V ⊂ y(I),由y−1(V )为I的开子集,从而为可数个不交开区间的并,记为Inn≥1(可

有限)。则D = φ(V )为可数条不交曲线的并,但在平面上光滑曲线为2维零测集,从

而D的2维测度为0,这与D的2维测度大于零矛盾。

本文的证明将用到常微分方程中的极限环存在定理,并涉及ω-极限点的概念(参

见[2]),因此我们引入如下定义:

定义1. 设y = y(t)是方程(1)的一条解曲线,则其存在区间为(−∞, ∞)。称一点p为

解y(t)的极限点,如果存在无限增加的t-值序列tk∞k=1, limk→∞ tk = ∞,使得

limk→∞

y(tk) = p.

解y(t)的所有ω-极限点的集合称为ω-极限集合,记为Ω.

同理,可定义解y(t)当t → −∞的ω-极限点,相应的极限集合记为Ω′.

有了如上定义,完全同通常的微分方程ω-极限点的讨论,我们可以得到如下性质:

a. Ω, Ω′是S2上的非空闭集。

b.若y0 ∈ Ω,设方程(1)满足初值y(0) = y0的不可延拓解为y(t, y0),则 y(t, y0) ∈ Ω, ∀t ∈R;对Ω

′有同样的结论成立。

关于ω-极限点的详细的讨论可参见[2].

常微分方程中平面上与ω-极限点相关的一个结论是极限环存在定理(参见[2] Page

193),我们现在希望建立S2上与此相对应的定理,有如下命题:

命题2. 设y = y(t)是方程(1)的一条解曲线,若y(t)本身不是闭轨(周期解),且Ω, Ω′不含平

衡位置(满足f(y) = 0的点y称为平衡位置),则Ω,Ω′是两条不相交的闭轨K,K

′的像集,且

当t → +∞时y(t)盘旋逼近K,当t → −∞时y(t)盘旋逼近K′。

我们将通过转化到通常的微分方程中极限环存在定理(参见[2])而予以证明。同样限于

篇幅,这里将只给出一个简略证明,一个相关的证明可参阅[2]。如果对极限环的概念非

常熟悉,读者可直接跳到下一节。

32

Page 36: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

证明. 令y为Ω中的任一点,由引理1知存在y0 ∈ S2 \ y,并与解曲线y(t)不交。则可

以y0为极点作球极投影,得到一张局部图φ : R2 → S2 \ y0,从而得到平面上方程

dx

dt= fφ(x) (2)

的解曲线x(t) = φ−1 y(t),fφ为平面上的非零光滑向量场,且b = φ−1(y)是它的一

个ω−极限点。由b不是平衡位置,可过b作一条直线段AB与fφ(b)相交(不相切),且线段的长度取

得足够小,使得经过该线段的解曲线都与其相交在同一方向(不相切),因fφ(b) = 0.

由b为解曲线x(t)的ω-极限点,所以线段AB与x(t)有无穷多个交点。设其中两个相继的交

点为a1 = x(t1), a2 = x(t2), t1 < t2,则解曲线x(t)的一段x[t1, t2]并上线段a2a1 构成一条

Jordan曲线Γ。由 Jordan曲线定理,Γ将平面分成两个区域G1, G2,其中一个有界,一

个无界,且均以Γ为边界。由道路连通性,x(] − ∞, t1[), x(]t2, ∞[分别在一个区域中,而

且x(] − ∞, t1[), x(]t2, ∞[)分属两个不同的区域(这在直观上是显然的,并可以用卷绕数的

概念给予证明)。不妨设G2有界,则x(] − ∞, t1[)或x(]t2, ∞[)包含于G2。不妨设为后者(否

则可以考虑将向量场反号),考虑ω-极限点,x(t)当t → ∞时的极限点集记为Ω,由通常的

极限环存在定理得出Ω 是一条闭轨K的像集,且包含在G2中,而当t → +∞时x(t) 盘旋逼

近K,换到S2中则已对Ω完成证明。再另作一次球极投影(取φ(p)为极点,p包含在K围成

的有界区域内),并利用微分方程中极限环存在定理,则对Ω′有同样的结论成立。

a2

a1

G2

G1

B

A

b

图 1 极限环

3 S2上不存在非零光滑切向量场

基于上节的讨论,我们来证明如下结论:

命题3. S2上不存在非零的光滑切向量场。

33

Page 37: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

证明. 反之,假设命题3不成立,其上存在非零光滑向量场。可在S2上由向量场定义微分

方程(1),则由上一节的命题2,我们可找到S2上一条闭轨,记为Γ0。通过球极投影,可

对应到平面上一条闭轨,记为γ0,由 Jordan曲线定理,将平面分成两个区域,分别有界

和无界。因此,可设I(γ0)为其内部(即有界区域),O(γ0)为其外部(以后均采用以上记法)。

此时对应到坐标平面上有方程:

dx

dt= f(x)

其中f为X = I(γ0)上对应的非零光滑向量场,γ0为闭轨。我们要证明这是不可能的。

为此,我们先做一些准备:

引理2. 平面上任两条不交曲线J1, J2,若I(J1) ∩ I(J2) = ∅,则I(J1) ⊂ I(J2) 或I(J2) ⊂I(J1)。

证明是基本的。

引理3. 对X中的任一闭轨γ,存在闭轨γ′,使I(γ′) ⊂ I(γ)。

注意到方程(1)过S2上任一点均存在唯一的一条光滑解曲线,取以I(γ)中一点为初值的解

曲线y(t),由上一节命题2,或者其自身是闭轨,或者其ω-极限点集是两条不相交的闭轨,

其中一条包含在I(γ)中。

现在来证明命题3:

1.在X中,若存在闭轨Γ,使在I(Γ)中,任两条不相同的闭轨γ1, γ2,或者I(γ1) ⊂ I(γ2),

或者I(γ2) ⊂ I(γ1)。令A = γ| I(γ) ⊂ I(Γ), F = ∩γ∈AI(γ),则F为闭集,且A中任意有

限个闭轨γknk=1,有∩n

k=1I(γk) = ∅。因此,由紧集的有限交性质知F = ∅. 取x0 ∈ F,则

方程有解曲线x(t), x(0) = x0,x(t)完全包含在F中,且x(t)本身为闭轨或者其极限点集为

闭轨。总之,存在闭轨γ0 ⊂ F。由引理2及F的定义知I(γ0) ⊂ F。再由引理3知,存在闭

轨γ′0, I(γ

′0) ⊂ I(γ0)。注意到γ

′0 ∈ A,从而F ⊂ I(γ

′0),这与I(γ

′0) ( I(γ0) ⊂ F矛盾。

2.若1不成立,则任一条闭轨Γ,存在不交闭轨Γ1, Γ2 ⊂ I(Γ),而I(Γ1) ∩ I(Γ2) = ∅。于是在X中,可找到闭轨序列

γ1, γ2, . . .

I(γi+1) ⊂ I(γi)(i ≥ 1)

且S(I(γi+1)) ≤ 12S(I(γi)). 由γi为光滑闭轨,因此可以定义面积。

34

Page 38: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

令F = ∩∞i=1I(γi),则F为闭集,且同前讨论知F = ∅。可找到闭轨γ0, I(γ0) ⊂ F,此

时S(I(γ0)) > 0,但

I(γ0) ⊂ F ⊂ I(γi)

⇒ S(I(γ0)) ≤ S(I(γi)) ≤ 1

2i−1S(I(γ1))(∀i ≥ 1)

⇒ S(I(γ0)) = 0

得到矛盾。

因此,我们已证明了S2上不存在非零光滑切向量场。

4 光滑逼近

现在还剩下一个问题,我们需要证明的是S2不存在非零连续切向量场,我们用反证

法。为得到矛盾,我们考虑光滑逼近。为此,我们来证明:

断言(1): 若S2存在非零连续切向量场,则其上也存在非零光滑切向量场。

若断言成立,则由上一节命题3即得到矛盾,从而证明了命题1.

设f为S2上的非零连续切向量场,则由S2是紧集知存在N > 0,使∥f(y)∥ ≥ N. 因此,

我们只需证明:

引理4. ∀ϵ > 0,对S2上的任何连续切向量场,存在其上的光滑切向量场g(y),使∥f(y) −g(y)∥ < ϵ(∀y ∈ S2)。

证明. 可以取到有限张覆盖S2的局部图(如球极投影)(Ui, φi)ni=1,并可取从属于(Ui, φi)n

i=1

的C∞−类单位分解fini=1,使

0 ≤ fi ≤ 1,

n∑

i=1

fi(y) = 1(∀y ∈ S2)

supp fi ⊂ φi(I2)(I =]0, 1[)

从而f(y) =∑n

i=1 fi(y)f(y). 这样,只需证明:存在光滑切向量场gi(y),满足

∥gi(y) − fi(y)f(y)∥ <ϵ

n

而在局部坐标中看,即只需证明:

∀ϵ > 0,存在R2上的光滑向量场gi,使∥gi(x) − fi(x)∥ < ϵ,且supp gi有界。

(其中,φ′i(x)fi(x) = fi(y)f(y), x = φ−1(y),即fi为f 由局部图(Ui, φi)对应到坐标平面上

的切向量场,由fi的定义知supp fi ⊂ I2).

考虑分量fi = (fi1, fi

2),则问题又可转化为函数情形。而这又成为我们熟知的结论:

35

Page 39: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

引理5. 任何一个在R2上具紧支的连续函数可以由具紧支的光滑函数一致逼近。

证明可利用卷积的方法给出,具体可参见[1]。也可再考虑单位分解,仿照 Tietze扩

张定理(参见[3])的证明给出另一证明。

5 结语

现在来对本文作一个简单的总结。本文的命题是代数拓扑学中的一个经典结论,当

然,这一结论对偶数维的球面都是正确的,然而为证一般的结论则须论及偶数维与奇数维

的不同,这无法避免地将涉及球面的拓扑结构而不只是分析的论证,实际上源于两者的欧

拉数分别为2和0,因此本文仅限于最简单的情形。一般结论的几个经典证明可以由下给

出:代数拓扑中映射度理论([4]);微分拓扑 Poincare-Hopf定理的简单推论([5]);初等证

明[6]。(以上文献由杜升华学长建议并提供,在此表示感谢。)

参考文献

[1] V.A.Zorich, 数学分析(第二卷), 高等教育出版社, 2006。

[2] 庞特里亚金, 常微分方程, 高等教育出版社, 2006。

[3] James R.Munkres, Topology, China machine press, 2004。

[4] James R.Munkres, Elements of algebraic topology, Addison-Wesley, 1984。

[5] John W.Milnor, 从微分观点看拓扑, 熊金城译, 人民邮电出版社, 2008。

[6] John W.Milnor, Analytic proofs of “Hairy Ball Theorem” and the Brouwer Fixed

Point Theorem, The American Mathematical Monthly, Vol.85.

[7] John M.Lee, An introduction to smooth manifolds, GTM 218.

36

Page 40: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

随机控制简介

——离散型随机控制问题

冯鑫∗

1 历史回顾

自维纳创立控制论以来,最优控制(optimal control)理论逐渐成为现代控制论的核

心。而其中又有一类问题是最近几十年才成为重要研究对象的,那就是下文将要介绍的随

机控制问题(stochastic control theory)。

我们首先看一下普通的最优控制问题,然后我将会指出由普通的最优控制问题如何过

渡到随机控制问题。

一个普通最优控制问题的核心部分有三个:其一是带控制函数的动力系统。如下:

dx(t)

dt = f(t, x(t), u)

x(0) = x

其二是所有可用控制的全体U,U是一个函数集,函数集中可能只有某些特定类型的

函数,比如U可以是u | u is measurable, u(t) ∈ 1, 2, 3,∀t ≥ 0。也就是说控制函数是值域为1, 2, 3的可测简单函数,若限定u只能取固定值,则上述动力系统退化到普通的动力

系统。

其三是我们的目标函数,通常考虑的目标函数具有如下形式:

J(u, x) =

∫ T

0r(t, x(t), u)dt + g(x(T ))

其中的T可能是固定时间也可以是停止时间(例如:T = inft, x(t) < 0),我们的任务是要找出u∗(x) ∈ U使得:

J(u∗(x), x) = supu∈U

J(u, x) = φ(x)

∗基数81

37

Page 41: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

当然,还有一些关于所涉及函数的技术性的条件,但在这里就不赘述了。

我们最关心的问题当然是如何求出φ(x)和u∗(x)的具体表达式,或者至少提供一个能

够确定它们的算法。

解决这类问题的主要方法有两类,一类是由 Bellman 提出的动态规划,另一类是

Pontryagin提出的极大值原理。这两大类方法后来都在研究对象由普通最优控制问题转

变为随机控制问题之后逐渐发展出了各自的随机形式。(有兴趣的读者可以查阅相关资料:

[1],[2])

随机控制问题与普通最优控制问题的区别主要是给定的动力系统是随机动力系统而

不是普通的动力系统。一个随机动力系统就是一个满足给定随机微分方程的随机过程。

如: dx(t) = α(t, x(t))dt + σ(t, x(t))dB(t)

x(0) = x

其中B(t)是概率空间(Ω, F , Ftt≥0, P )上的标准布朗运动。(这里也省略了不少细节,

关于随机微分方程的准确定义和相关知识,读者可以参阅[3])

直观上看,它与一般动力系统的差别就是增加了一个随机扰动项dB(t)(事实上,随

机扰动的形式可以更广泛)。

随机控制问题之中给定的是带控制函数的随机动力系统:

dx(t) = α(t, x(t), u)dt + σ(t, x(t), u)dB(t)

x(0) = x

(这里再次省略了一些对函数α, σ的限制,但与前面省略的细节一样,都不会影响到本文

主题的表现)

可用控制全体的定义不需要修改,但是目标函数的定义需要自然地修改成为

J(u) = Ex

∫ T

0r(t, x(t), u)dt + g(x(T ))

其中Ex表示初值为x时的期望。这样,我们就由普通最优控制问题过渡到了随机控制问

题。下文将以离散型问题为例介绍随机控制问题的几个例子和基本的处理方法。

2 离散型随机控制问题

随机控制问题的实例随处可见,如交通管理就可以作为一个典型的随机控制问题来研

究。但是由于技术限制,我们暂时只把注意力集中在很普通的例子上。

38

Page 42: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

随机控制的思想其实早就已经十分普遍,甚至一些电视剧的情节都体现出了这种思

想。我假定大家都看过这样的剧情:

Boss:“这是一半佣金,事成之后还有另一半!”

Killer:“没问题,把另一半准备好吧!”

这段简单的对话就体现出了随机控制的思想。为什么这么说?我们知道Killer能否完

成任务不是确定的,而应该把killer执行任务的结果理解为一个随机变量,不妨假设它就

是定义在概率空间(Ω, F , P ) 上的随机变量Z,Z ∼ B(1, p),Z = 1表示Killer完成了任务,

Z = 0反之,也就是说我们认为Killer能完成任务的概率是p。Boss显然也是考虑到Killer能

否完成任务是不确定的,所以不能预付过多佣金,否则Killer不会尽力完成任务,因为已

经到手的佣金比例已很高。

但若预先支付的佣金太少,Killer可能会放弃任务,因为Killer和Boss一样知道自己能

否完成任务是不确定的(对手的实力难以准确估计),可能会失败并受到重创,因而预付

佣金太少就不值得自己冒险,那么究竟该如何选择预付佣金比例?我们可以把这个问题看

作一个简单的随机控制问题。根据上面的分析,概率p应该是预付佣金比例λ的先增后减

函数(例如p(λ) = λ − λ2)。

我们假定Boss的目标是最大化:

J(λ) = Ef(Z) + g(λ)

(f, g是两个视具体情形而定的函数,他们的具体形式可以体现出佣金和任务被完成

对Boss的重要程度的差异)

例如:取p(λ) = λ − λ2, f(x) = x, g(x) = 0,则J(λ) = EZ = p(λ) = λ − λ2。因

而λ应该取为12。Boss显然不会是因为经过了上述分析而选择了1

2的预付比例,但是至少可

以看出他已经有些随机控制的思想了,就是要尽量把不确定性考虑进来,并设计好的应对

策略。

上面的简单例子就作为引子,我们再来看一个稍微复杂的例子。

假定将来你有机会去拉斯维加斯或者澳门旅游,我想你当然不会不想去玩一玩赌博游

戏,对我们来说重要的是原理,所以我准备又一次偷懒,我们只考虑买庄,买闲这种简单

的游戏。游戏规则是,你下注赌庄家赢或赌闲家赢,赌中则你收回赌注,输家赔给你与你

所下赌注等量的筹码,赌输则赌注被赢家收走。稍有一点概率知识的人都知道,假设庄闲

赢的概率相等,那么我们每次下注的期望收益都是0,这是赌博者很难赢的原因,但是如

果我们采用所谓的倍赌策略(查一下英语词典就可以发现这正是单词martingale最初的意

思,它在概率论中被翻译为鞅),比如每次输后都将赌注加大为原来的3倍,这样无论你已

经连续赌输多少把,你只需要赢一次就可以彻底反败为胜! 我们可以严格的证明这一点,

39

Page 43: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

当然我们要假设你可以无限地借入筹码而且没有下注上限。

利用概率空间(Ω, F , P )上的iid的随机变量序列Xnn≥1来表示每次的下注结果,

Xn = 1表示赢,反之为输。且不妨假设Xn ∼ B(1, 12)。

用Rn来表示第n + 1次下注前的筹码总量。

设R0 = 0,且第n次下注量为3n个筹码,于是Rn =∑n

1 3k(2Xk − 1),由于Xn iid ∼B(1, 1

2),所以显然Rn关于Xnn≥1 生成的σ域流是一个鞅(这或许是鞅这一对象的最初

来源)。

记T (ω) = infn, Xn(ω) ≥ 0。那么我们有随机变量

RT = 3T −T−1∑

k=1

3k =3T + 3

2

容易知道

ERT =∞∑

k=1

3k + 3

2k+1= +∞

这就是在允许无限借贷的条件下倍赌策略必胜的原因。但是现实中不可能允许你无限借

贷,即使允许无限借贷,一般也会有下注上限。

在有限制条件和特殊目标的时候,我们面对的问题就变成一个稍微复杂的随机控制问

题。现在假设你和你的朋友都是概率专家,对上面的分析了如指掌。你们一致认为:赢,

是没有挑战性的,要赢得迅速才有挑战性。

你和朋友约定起始筹码每人5个,两人比赛,谁先赢够10个筹码则为胜者。为

了分析这个问题,我们先将它一般化。保留前面的Xn, Rn 的定义。再定义Fn =

σRk, 1 ≤ k ≤ n,并且设U = u, u = (un)n≥1,其中un为N → N的函数, un(k) ≤k,第n次下注量为un(Rn−1),τ(ω) = infn ≥ 0, Rn(ω) ≥ 10,不允许借贷。

于是问题转化为下面的离散型随机控制问题:

Rn − Rn−1 = un(Rn−1) · (2Xn − 1)

R0 = r

J(u, r) = Eur (exp(−τ))(τ可能取+∞,对应于n ≥ 0, Rn(ω) ≥ 10为空集)目标是要找

出初值为r时的最优下注策略u∗(r) ∈ U使得

J(u∗(r), r) = sup

u∈UJ(u, r) = φ(r)

我们假定对应于任何初值r的最优策略u∗(r)是存在的。注意到Xn iid ∼ B(1, 1

2),那么当我

们下注n次后处于Rn = r的状态时,我们所面临的问题与最开始时处于R0 = r的状态是完

全相同的!也就是说我们的最优策略一定是在第n + 1次下注(u∗(r))1(r),即下注量为初值

40

Page 44: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

为r时的最优策略的第一次下注的量。于是记v(r) = (u∗(r))1(r),那么第n次最优下注量一

定是v(Rn−1)。

所以最优策略实际上与初值无关,可记为u∗ = (u∗n)n≥1,其中u∗

n = v, ∀n。于是采用

最优策略时我们有: Rn − Rn−1 = v(Rn−1) · (2Xn − 1)

R0 = r

(以下讨论的Rn都由此方程决定),且此时φ(r) = J(u∗, r) = Eu∗r (exp(−τ)),Fn j

σXk, 1 ≤ k ≤ n。Rn = Rn−1 + v(Rn−1) · (2Xn − 1),再根据Xn与Fn−1独立知:

Eu∗r (f(Rn) | Fn−1) = Eu∗

r (f(Rn−1 + v(Rn−1) · (2Xn − 1)) | Fn−1)

= Eu∗r (f(Rn−1 + v(Rn−1) · (2Xn − 1)) | Rn−1)

= Eu∗r (f(Rn) | Rn−1)

从而Rn为马氏过程。进一步我们将证明它是时间齐次的马氏过程:P u∗r (Rn+m = i |

Rn) = P u∗Rn

(Rm = i)。为此,只要证明∀j有:P u∗r (Rn+m = i | Rn = j) = P u∗

j (Rm = i)。

固定n,记Ym为满足以下方程的随机过程

Ym − Ym−1 = v(Ym−1) · (2Xn+m − 1)

Y0 = j

那么由于Xn iid ∼ B(1, 12),我们有:

(1)Ym与σXk, 1 ≤ k ≤ n独立,从而与Fn独立

(2)Ym与初值为j的Rm同分布

(3)在Rn = j上,Ym = Rn+m

于是

P u∗r (Rn+m = i | Rn = j) = P u∗

r (Rn+m = i, Rn = j)/P u∗r (Rn = j)

= P u∗r (Ym = i, Rn = j)/P u∗

r (Rn = j)

= P u∗r (Ym = i) · P u∗

r (Rn = j)/P u∗r (Rn = j)

= P u∗r (Ym = i)

= P u∗j (Rm = i)

证明完成。

下面利用时间齐次马氏过程的马氏性导出一个结论。为方便叙述,先指出时间推移算

子θn的作用。

41

Page 45: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

注意到θn(τ) = τ − n(当τ ≥ n时),于是利用马氏性,我们有:

φ(r) = Eu∗r (exp(−τ))

= E(Eu∗r (exp(−τ) | R1))

= e−1E(Eu∗r (exp(−(τ − 1)) | R1))

= e−1E(Eu∗r (exp(−θ1(τ)) | R1))

= e−1E(Eu∗R1

exp(−τ))

= e−1

(1

2(Eu∗

r−v(r) exp(−τ)) +1

2(Eu∗

r+v(r) exp(−τ))

)

=φ(r − v(r)) + φ(r + v(r))

2e(∗)

又注意到实际上证明P u∗r (Rn+m = i | Rn) = P u∗

Rn(Rm = i)的过程中,若n ≥ 1,则并

不需要R1 − R0 = v(R0) · (2X1 − 1)。从而对任意的k,R1 − R0 = k · (2X1 − 1),都

有P u∗r (Rn+m = i | Rn) = P u∗

Rn(Rm = i)。

于是记u = (un)n≥1,其中un = v, n ≥ 2; u1 = k. 则由φ(r)的定义可知:φ(r) ≥Eu

r (exp(−τ)) = (φ(r − k) + φ(r + k))/2e(此等式可与(∗)同样得到)。于是由v(r)的定义

知v(r)为使φ(r − k) + φ(r + k)取最大值的k。

另外我们容易得到:φ(r1 + r2) ≥ maxφ(r1), φ(r2), φ(r) = 1, v(r) = 0,∀r ≥10; v(9) = 1. 后面的工作应该可以借助计算机编程做,详细过程留给有兴趣的读者去完

成。

我想读者已经发现这种思路正是一种被称为动态规划的算法,这可以认为是 Bellman

的动态规划方法的一个离散版本,另外我试图寻找过 Pontryagin的极大值原理的一个离

散版本,可惜水平所限,未能如愿。

至此,相信读者对于随机控制方法及其应用已经有了初步的认识。利用随机控制方

法,我们可以摆脱由于不确定性过多而只能“听天由命”的困境,而是可以胸有成竹地随

机应变,因为随机控制考虑到了系统可能进入的所有状态,并对每种状态都给出了相应的

控制方案,所以我相信它毫无悬念地会得到极为广泛的应用。

参考文献

[1] Lawrence C.Evans; A Introduction to Mathematical Optimal Control Theory

[2] Pontryagin; The Mathematical Theory of Optimal Process

[3] Protter; Stochastic Integration and Differential Equations

42

Page 46: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

高等代数中的拓扑

张端阳∗

在高等代数课程中,我们考虑的往往是单个的矩阵,现在我们将具有某种性质的矩阵

放在一起,并在这个集合上引入拓扑,本文的目的是考查这个拓扑空间的一些拓扑性质.

我们考虑的主要是以下集合:

GL(n; F ):系数在 F 中的 n阶可逆方阵全体,这里 F = R或 C;SL(n; F ): 系数在 F 中的 n阶可逆方阵且行列式为 1的全体;

O(n): n阶正交阵全体,即 A ∈ Mn(R) : AT A = In;SO(n): n阶正交阵且行列式为 1的全体;

U(n): n阶酉阵全体,即 A ∈ Mn(C) : AT A = In;SU(n): n阶酉阵且行列式为 1的全体.

这些集合在以后的某些课程(如李群与李代数)中会经常出现.

1 拓扑的引入

作为实线性空间,Mn(R) 与 Rn2同构,因此我们可以将 Rn2

上的欧氏度量诱导到

Mn(R)中去,即若 A = (aij), B = (bij) ∈ Mn(R),则定义 A与 B的“距离”为√√√√

n∑

i,j=1

(aij − bij)2,

这样 Mn(R) 成为一个度量空间,其上的拓扑则定义为由该度量诱导的拓扑. GL(n; R),

SL(n; R), O(n), SO(n)上的拓扑则定义为子空间拓扑.

类似地,可以定义Mn(C)上的拓扑.

在这样定义的拓扑下,矩阵的加法、乘法、取行列式、取逆都是连续的,前三个容易

看出,最后一个可通过逆与古典伴随方阵的关系得到.

高等代数中某些熟悉的结论现在可以用拓扑的语言重新写一遍,比如结论“A,B 正

定,t ∈ [0, 1],则 tA + (1 − t)B 也正定”现在就可以写作正定阵全体所构成的拓扑空间是

凸集(从而可缩,即与单点同伦等价).

∗基数73

43

Page 47: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

GL(n; F ), SL(n;F ), O(n), SO(n), U(n), SU(n)在矩阵的乘法下都构成群,对于这种

既有群结构又有拓扑空间结构且两种结构相容(即群的乘法和取逆连续)的集合,我们取

一个名字叫做拓扑群.

当 n比较小的时候,上述群可用我们更熟悉的空间表示. 比如 SO(2) ∼= U(1) ∼= S1,

SU(2) ∼= S3, U(2) ∼= S3 × S1, SO(3) ∼= RP 3. 除了最后一个式子,同胚关系均不难建立

(其实就是解方程组),我们具体写出 U(2)到 S3 × S1的同胚如下:

U(2) → S3 × S1,

(a b

c d

)7→ ((Re c, Im c,Re d, Im d), ad − bc),

逆映射为

S3 × S1 → U(2), ((x1, x2, x3, x4), α) 7→(

α(x3 − x4i) −α(x1 − x2i)

x1 + x2i x3 + x4i

).

最后一个式子有些复杂,证明可以参见 [2]的 1.6节或 [5]的 3.D节.

2 有关点集拓扑的性质

关于拓扑群有很多一般的性质,比如一个拓扑群满足 T1公理当且仅当它是 Hausdorff

的,更多有趣的性质和证明可以在 [7]的第一节中找到. 我们这里关心的是连通性与紧致

性.

2.1 连通性

本节所需结论均包含在 [1]中,读者可先自己试证以检验高等代数的掌握程度.

命题 2.1 GL(n; C)连通.

J 只须证明每个复可逆矩阵都可以和单位阵相连,且道路整体落在 GL(n; C)中即可.

现设 A ∈ GL(n; C),由 [1]定理 6.12知,存在可逆阵 P,使得 B = P−1AP 是上三角阵,

对角线上的元素为 A的特征值,由 A可逆知,这 n个数均不为 0. 对每个非零复数,均可

找到不经过原点的道路将其与 1相连. 这样 B 可与 B1 通过 GL(n; C)中的道路相连,其

中 B1 的对角线元素均为 1,对角线以上的部分与 B 的相同. (上面之所以要求不经过原

点,就是为了保证道路落在 GL(n; C)中.) 下面可将对角线以上的元素任意与 0相连,因

为在这个过程中,行列式始终为 1(从而落在 GL(n; C)中). 于是我们找到了一条落在

GL(n; C)中的道路 B(t),起点为 B,终点是单位阵. 从而 A(t) = PB(t)P−1 便是我们要

找的道路. I用完全一样的办法可以证明:

44

Page 48: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

命题 2.2 SL(n; C)连通.

利用关于酉阵的酉相似标准形([1]定理 9.19系 2)可以类似证明

命题 2.3 U(n), SU(n)连通.

我们看到以上四种复系数的矩阵都是连通的,如果换成实系数还成立吗?答案是否定

的,比如 GL(n; R)就不连通,否则连续映射

det : GL(n; R) → R

的像 R\0应该是连通的,但 R\0显然有两个连通分支. 如果想套用上面的证明方法

就会发现,并不是对每个实数都存在将其与 1相连且不经过原点的道路,在复数的情形可

以通过多的一个维度“绕”过去. 事实上可以证明以下结果:

命题 2.4 如果记 GL(n; R)+ 为行列式大于 0的 n阶矩阵全体,则 GL(n; R)+ 连通,从而

GL(n; R)有两个连通分支.

J 证明的关键一步是要想到用极分解([1]定理 9.11). 设 A是 n阶实矩阵且行列式

大于 0,则 A可表为

A = SΩ,

其中 S 是正定阵,Ω ∈ O(n). 事实上,由 det A > 0,Ω ∈ SO(n).

正定阵所构成的拓扑空间可缩,当然连通.

由正交阵的正交相似标准形([1] 定理 9.5 系 1)可知,SO(n) 连通(标准形的对

角线上为

(cos θ sin θ

− sin θ cos θ

), 1 或 −1,且 −1 有偶数个.

(cos θ sin θ

− sin θ cos θ

)可以通过道路

(cos tθ sin tθ

− sin tθ cos tθ

)变成 I2;1不动;

(−1 0

0 −1

)即相当于第一情况 θ = π的情形.)

将以上两点结合起来便可知,GL(n; R)+ 连通. 同理可知 GL(n; R)− 也连通,从而

GL(n; R)有两个连通分支. I用类似的方法可以证明 O(n)有两个连通分支,SL(n; R)连通.

2.2 紧致性

紧致性的考查要比连通性容易得多,因为欧氏空间中的紧集有很好的刻画:有界闭.

GL(n; R)是Mn(R)中的开集,因为它是 R中开集 R\0在连续映射 det : Mn(R) →R下的原像. 同样 GL(n; C)是Mn(C)中的开集. 其他集合都是通过等式定义出来的,因

此都是闭集.

45

Page 49: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

O(n) 是有界集,因为正交矩阵每列元素的平方和为 1,故每个位置上的元素均界

于 −1 与 1 之间. 同理可知 SO(n), U(n), SU(n) 都是有界集. 当 n ≥ 2 时,SL(n; R)

和SL(n; C)就不是有界集了,一个简单的例子是: Am 是对角阵,对角线上元素依次为

m, 1m , 1, · · · , 1.

故O(n), SO(n), U(n), SU(n)是紧致集,GL(n; R), GL(n; C), SL(n; R), SL(n; C)不是

紧致集.

3 基本群

算基本群可不是件容易的事,我们回忆在拓扑学的课程中,计算过基本群的空间寥寥

无几,大部分还得益于一个证明被放在附录中的 Van-Kampen定理. 在算具体例子之前,

我们先来看一个一般的定理.

定理 3.1 拓扑群的基本群是交换群.

因此“8”字形上不可能有拓扑群的结构.

J 设 G是一个拓扑群,f, g : [0, 1] → G,f(0) = f(1) = g(0) = g(1) = e是 G中以 e

为基点的两条道路. 记通常的道路乘积为 f.g,即

f.g : I → G, f.g(t) =

f(2t) 0 ≤ t ≤ 1

2

g(2t − 1) 12 ≤ t ≤ 1.

道路乘积可以定义在道路的同伦类上,从而诱导了基本群中的乘法. 如果用 [f ]表示 f 在

同伦意义下的等价类,则我们要证明 [f ].[g] = [g].[f ].

对于道路还可以定义另一种乘积

f ∗ g : [0, 1] → G, t 7→ f(t) · g(t),

其中“ ·”为群 G中的乘法. 这种乘积也可以定义在同伦类上. 事实上,若 F, G分别是 f1

到 f2和 g1到 g2的同伦,则 (t, s) 7→ F (t, s) · G(t, s)建立了 f1 ∗ g1到 f2 ∗ g2的同伦.

两种乘法被以下关系式所联系起来

f.g = (f.ce) ∗ (ce.g),

其中 ce 是在 e 处的点道路. 则 [f ].[g] = [f.ce] ∗ [ce.g] = [f ] ∗ [g]. 从而我们只需证明

[f ] ∗ [g] = [g] ∗ [f ]. 这可以通过构造同伦

(t, s) 7→ f−1(ts) · f(s) · g(s) · f(ts)

46

Page 50: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

来实现. I为了计算 SO(n)和 U(n)的基本群,我们先指出它们都有所谓的“纤维丛”结构:(关

于纤维丛的定义和例子可参见 [3])

SO(n − 1) // SO(n)

Sn−1

, U(n − 1) // U(n)

S2n−1.

我们这里用

F // E

p

B.

表示 E 是底空间 B 上的纤维丛,纤维是 F,p : E → B 是投影映射. 这两个纤维丛结构

的严格证明要用到李群中的结果([6]定理 3.58),我们这里只指出投影映射是将矩阵映到

它的第一列.

纤维丛是乘积空间的推广,它在局部上就同胚于乘积空间,但在整体上可能多了一

些“扭曲”. 关于乘积空间的基本群有很好的结果,即如果 X,Y 都是道路连通的拓扑空间,

π1(X × Y ) ∼= π1(X) × π1(Y ).

因此,我们有理由相信关于纤维丛的基本群也应有比较好的结果. 事实上也如此,

定理 3.2 设 B 是底空间,E 是其上的纤维丛,纤维是 F . 如果 B, E, F 都道路连通,则

有长正合列

· · · // πn(F ) // πn(E)p∗ // πn(B) // πn−1(F ) // · · · // π1(B) // 0.

这里有一些名词和符号需要解释一下.

设 A,B, C 是群,f : A → B, g : B → C 是群同态,我们称

Af // B

g // C

在 B处正合,如果 ker g = Imf .

在代数拓扑中经常会遇到正合列,它们是由已知群来“算出”未知群的强有力的工具.

设 X 是一个道路连通的拓扑空间,πn(X) 表示 X 的第 n 阶同伦群,其定义如下:

记 In = (t1, · · · , tn) | 0 ≤ ti ≤ 1, i = 1, 2, · · · , n 是 n 维方体,In 是 In 的边界. 取

定 X 中一点 x0,则 πn(X, x0)作为集合定义为 (In, In)到 (X, x0)的所有连续映射在同

47

Page 51: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

伦意义下的等价类,这里 (In, In) 到 (X, x0) 的映射是指将 In 映到 X 中并且将 In 都

映成 x0 的映射. 在集合 πn(X, x0)中可以定义乘法,设 f, g : (In, In) → (X, x0),定义

h = fg : (In, In) → (X, x0)为:

h(t1, t2, · · · , tn) =

f(2t1, t2, · · · , tn), 0 ≤ t1 ≤ 1

2

g(2t1 − 1, t2, · · · , tn), 12 ≤ t1 ≤ 1.

这个定义可以过渡到同伦类中,从而给出了 πn(X,x0)中的乘法. 同基本群时的情形一样,

当 X 道路连通时,可以证明对任意 x1, x2 ∈ X,πn(X,x1)与 πn(X,x2)同构,我们将这

个群就记为 πn(X).

我们熟悉的基本群其实是第 1阶同伦群,各阶同伦群都是同伦不变量,它们是区分两

空间的重要工具. 高阶同伦群(指 n ≥ 2)有很多很好的性质,比如它们总是交换的,再

比如一个空间的高阶同伦群和它的复叠空间的同阶同伦群是同构的,从而 S1 的高阶同伦

群都平凡(因为 S1 有万有复叠 R1,而 R1 可缩). 这些性质都是基本群所不具备的,但

Van-Kampen定理没有很好的高阶推广,这也使得高阶同伦群的计算变得异常困难,即使

连最“简单”的空间 S2,至今也未能确定它的所有阶同伦群. 可喜的是,经过很多大数学家

的努力,我们还是得到了不少一般结果,比如下面将要用到的 πn(Sm) = 0, 当 n < m时.

以上所列高阶同伦群的性质和长正合列的证明可在任何一本关于同伦论的书中找到,

比如 [5]的第四章.

为了计算基本群而“不得已”引入高阶同伦群(事实上,对于我们的情况,2阶就够

了),这实在是一件有趣并值得琢磨的事.

对 SO(n)的纤维丛结构用定理 2.2可得正合列

π2(Sn−1) // π1(SO(n − 1)) // π1(SO(n)) // π1(S

n−1) // 0.

当n ≥ 4时,π2(Sn−1) = 0 = π1(S

n−1),因此由正合性可知π1(SO(n−1)) ∼= π1(SO(n)), n ≥4. 又 π1(SO(3)) = π1(RP 3) = Z/2Z,故

π1(SO(n)) =

0 n = 1

Z n = 2

Z/2Z n ≥ 3.

当 n ≥ 3时,SO(n)的道路连通的 2重复叠(其实就是万有复叠)在 Seiberg-Witten

理论中起着重要的作用,人们给它起了个名字叫做 Spin(n). 可以证明 Spin(3) ∼=SU(2), Spin(4) ∼= SU(2) × SU(2),更多的内容可参见 [8].

对 U(n)的纤维丛结构用定理 2.2可得正合列

π2(S2n−1) // π1(U(n − 1)) // π1(U(n)) // π1(S

2n−1) // 0.

48

Page 52: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

当n ≥ 2时,π2(S2n−1) = 0 = π1(S

2n−1),因此由正合性可知π1(U(n−1)) ∼= π1(U(n)), n ≥2. 又 π1(U(1)) = Z, 故

π1(U(n)) = Z.

为求 SU(n)的基本群,我们考虑 U(n)的另一种纤维丛结构,

SU(n) // U(n)

p

S1

,

这里投影映射是取行列式.

从而有正合列

π2(S1) // π1(SU(n)) // π1(U(n))

p∗ // π1(S1) // 0.

代入 π1(U(n)) = Z, π1(S1) = Z, π2(S

1) = 0可得

0 // π1(SU(n)) // Zp∗ // Z // 0.

由正合性,p∗是 Z到 Z的满同态,故为同构,从而

π1(SU(n)) = 0.

O(n)是两个SO(n)的不交并(任取B ∈ O(n)\SO(n),则SO(n) → O(n)\SO(n), A 7→AB是同胚),故 π1(O(n)) = π1(SO(n)).

以上我们计算了四个紧集基本群,对于非紧的空间,它们可同伦到某个紧集.

命题 3.3 GL(n; R) 同胚于正定阵空间与 O(n) 的乘积空间,从而由正定阵空间可缩知,

GL(n; R)与 O(n)同伦.

J 还是用极分解. 对于任意 A ∈ GL(n; R),A 可唯一写成 A = SΩ 的形式,其中

S 是正定阵,Ω ∈ O(n). 考虑从 GL(n; R) 到正定阵空间与 O(n) 的乘积空间的映射,

A 7→ (S, Ω). 由分解的唯一性知此映射是单射,容易看出它还是满射,映射的逆即为矩阵

乘法因此连续,故我们只需证明映射本身连续即可.

S 和 Ω可具体写出来:S = (AAT )12 , Ω = (AAT )− 1

2 A. 因此问题归结于证明,如果 P

是正定阵,则映射 P 7→ P12 连续.

以下证明属于费腾1.

1基数73

49

Page 53: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

设 P 的特征值为 0 < λ1 ≤ · · · ≤ λn,记 P ′ = λnI − P,则 P ′ 的特征值为 0 ≤λn − λn−1 ≤ · · · ≤ λn − λ1(< λn). 现对 P 赋予算子范数

∥P∥0 := sup∥x∥=1

∥Px∥,

由有限维空间上的范数等价(泛函分析中的一个定理),算子范数与之前的度量诱导了相

同的拓扑,故我们只需证明在算子范数意义下映射是连续的即可. 容易知道,对于正定阵,

算子范数就等于它的最大特征值. 因此 λn = ∥P∥0关于 P 连续,故 P ′也关于 P 连续.

现在,由于 ∥ P ′λn

∥0 = λn−λ1λn

< 1,故幂级数

1 − 1

2

P ′

λn− 1

8

P ′2

λ2n

− · · · + (−1)k

(−1/2

k

)P ′k

λkn

+ · · ·

收敛且关于 P ′ 连续,进而关于 P 连续. 我们记收敛到的方阵为 A,则 A2 = I − P ′λn

.(事

实上,上面的幂级数就是由 (I − P ′λn

)12 形式展开而得到的.)A是一个正定阵,这是因为它

的特征值(将 P ′的特征值代入幂级数中得到)√

λ1λn

,√

λ2λn

, · · · , 1均大于 0. 由正定阵平方

根的唯一性知,A = (I − P ′λn

)12 . 于是,P

12 =

√λnA关于 P 连续. I

于是 π1(GL(n; R) = π1(O(n)).

类似地,π1(SL(n; R) = π1(SO(n)), π1(GL(n; C)) = π1(U(n)) = Z, π1(SL(n; C)) =

π1(SU(n)) = 0.

最后将文中的结论整理成如下表格:

拓扑空间 连通分支个数 是否紧 基本群

GL(n; R) 2 否 同 SO(n)

SL(n; R) 1 否 同 SO(n)

GL(n; C) 1 否 ZSL(n; C) 1 否 0

O(n) 2 是 同 SO(n)

SO(n) 1 是

0 n = 1

Z n = 2

Z/2Z n ≥ 3.

U(n) 1 是 ZSU(n) 1 是 0

参考文献

[1] 张贤科, 许甫华, 高等代数学(第 2版), 清华大学出版社.

50

Page 54: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

[2] B.C.Hall, Lie Groups, Lie Algebras, and Representations An Elementary Introduc-

tion(GTM222), Springer.

[3] 高挺然, 纤维丛和 Hopf纤维化, 荷思(第5期), 2010.5.

[4] 尤承业, 基础拓扑学讲义, 北京大学出版社.

[5] A.Hatcher, Algebraic Topology, Cambridge University Press, 2002.

[6] Warner, Foundations of Differentiable Manifolds and Lie Groups(GTM94), Springer.

[7] D.Ramakrishnan, R.J.Valenza, Fourier Analysis on Number Fields(GTM186),

Springer.

[8] J.W.Morgan, The Seiberg-Witten Equations and Applications to the Topology of

Smooth Four-Manifolds, Princeton, New Jersey, 1996.

数学名言

我认为,发展数学兴趣所要做的最重要的事是有能力和自由与数学玩。

——陶哲轩

51

Page 55: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

椭圆曲线及其j-不变量

毛天一∗

1 引言

椭圆曲线(elliptic curve)是数论中重要的对象。很多现代的数论研究领域与它有密

切的联系,例如Fermat大定理的证明就被转化为满足一些条件的椭圆曲线的存在性问题。

椭圆曲线有相对具体的几何形象,同时自身拥有特殊的群结构。对我们初学现代数论的学

生而言,提供了很多较容易接触的例子。

j-不变量(也称j函数)是椭圆曲线的重要不变量。在代数曲线(或者更进一步说,

代数几何)的研究中,用不变量刻画对象在同构变换下保持的性质是一种常见的手段。粗

略地说,j-不变量在同构意义下完全决定了椭圆曲线。因此,它本身作为上半复平面上的

函数,很多性质都和椭圆曲线有关。

本文将只涉及C上的椭圆曲线这一较简单的情形,从椭圆函数开始,介绍椭圆曲线的基本性质与代数结构,并以此证明j函数的一个重要性质。本文略去的大量证明都可以

在[1]或[2]中找到。在文章最后,将介绍关于j函数的一个有趣猜想。

2 C上的椭圆函数

我们首先引入复平面上格(lattice)的概念。称C的离散加法子群Λ为一个格,若Λ包

含了C的一组R-基。读者可以很容易地想象出平面上“整齐”地分布着一些点的形象。我

们希望研究的椭圆函数,其实是C/Λ上的函数。

定义1. 相对于格Λ的一个椭圆函数是一个C上的亚纯函数f(z),满足:

f(z + ω) = f(z),∀ω ∈ Λ, z ∈ C

将所有相对于Λ的椭圆函数的集合记为C(Λ)。

∗基数71

52

Page 56: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

椭圆函数都是周期函数。可以想象,该函数的图像是在平面上由很多相同的小块一

片片“铺砌”而成的。我们把这样的小块称为基本平行四边形(fundamental parallelo-

gram)。准确的定义如下:

定义2. 对给定的格Λ,一个基本平行四边形指的是以下形式的集合D:

D = a+ t1ω1 + t2ω2 : 0 ≤ t1, t2 < 1

其中a ∈ C,ω1, ω2是Λ的一组Z-基。

由复变函数中的Liouville定理不难知道:

命题1. 没有零点或极点的椭圆函数必为常值函数。

接下来我们构造一个非平凡的椭圆函数。

定义3. 设Λ是一个预先给定的格,其对应的Weierstrass ℘-函数为

℘(z) = z−2 +∑

0=ω∈Λ

((z − ω)−2 − ω−2)

权为2k的Eisenstein级数为

G2k =∑

0 =ω∈Λ

ω−2k

容易验证,G2k对任意k > 1绝对收敛,℘(z)在C − Λ的任何一个紧子集上绝对收敛。

因此℘定义了一个C上的亚纯函数,它仅在Λ的每点处有二阶极点,留数为0。我们可以证

明,它是一个偶的椭圆函数,而它的导数

℘′(z) = −2∑

ω∈Λ

(z − ω)−3

是一个奇的椭圆函数,并且一切椭圆函数都可以用℘和℘′的有理函数表示出来。不仅如此,

℘与℘′之间还有如下的代数关系:

命题2. 对∀z ∈ C− Λ,成立

℘′(z)2 = 4℘(z)3 − 60G4℘(z)− 140G6

这可以通过写出℘(z)在零点附近的Laurent级数

℘(z) = z−2 +∑

k≥1

(2k + 1)G2k+2z2k

来验证。该等式中涉及的两个系数特别地重记如下:g2 = 60G4,g3 = 140G6。在后文中,

它们对刻画C上的椭圆曲线有着重要作用。

53

Page 57: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

3 C上的椭圆曲线

我们不给出椭圆曲线的一般定义,仅就C上的情况讨论。以[X,Y, Z]记射影平

面P2(C)中的齐次坐标。我们称以下形式的三次方程

Y 2Z + a1XY Z + a3Y Z2 = X3 + a2X

2Z + a4XZ2 + a6Z

3

为Weierstrass方程,其中a1, . . . , a6 ∈ C。该方程给出的P2(C)中的曲线称为C上的椭圆曲线。更多时候我们采取更为简洁的非齐次坐标写法

y2 + a1xy + a3y = x3 + a2x2 + a4x+ a6

首先来定义椭圆曲线上点的加法。设E是一条椭圆曲线,P1, P2 ∈ E是其上两

点。过P1, P2作一条(射影)直线(若P1 = P2,则过P作E的切线。),由于决定E的

Weierstrass方程是三次的,故该直线与E还有一个交点P。记P的齐次坐标为[X0, Y0, Z0],

那么定义P ′ = [X0,−Y0, Z0]为P1与P2的和。同时注意到P, P′和O = [0, 1, 0]三点均在方

程XY Z0−X0Y Z = 0决定的射影直线上,故按加法的定义还有P +O = P和P +P ′ = 0成

立。换言之,我们找到了加法零元O和点P的逆元P ′ = −P,从而证明了椭圆曲线在此加法下是一个群。这是它最重要的代数特点。

我们再从几何上研究,为此需要定义椭圆曲线间的态射(morphism)。设C1和C2是

两条椭圆曲线,从C1到C2的有理映射是指映射

ϕ : C1 → C2

P = [PX , PY , PZ ] 7→ [ϕX(P ), ϕY (P ), ϕZ(P )]

其中ϕX(P ), ϕY (P ), ϕZ(P )都是关于P的坐标PX , PY , PZ的有理函数。态射则是那些“处处

正则”的有理函数:

定义4. 以C(C1)表示C1上的复系数有理函数。称有理映射ϕ = [ϕX(P ), ϕY (P ), ϕZ(P )] :

C1 → C2在P ∈ C1处正则(regular),若存在g ∈ C(C1)使得gϕX , gϕY , gϕZ在P处正则,且

三者不全为0。一个在C1上点点正则的有理映射称为一个态射。

一个不平凡的结论是:曲线间的一个态射,或者是常值的,或者是满射。

在态射中加入代数的要求,即给出同源映射(isogeny)的定义:

定义5. 称椭圆曲线间的态射ϕ : C1 → C2是一个同源映射,若ϕ(O) = O。

54

Page 58: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

又一个不平凡的结论是:对任意两条椭圆曲线E1, E2,同源映射是保持群运算的。所

以我们自然地用记号Hom(E1, E2)表示所有非常值的同源映射构成的群,并记End(E) =

Hom(E,E)为E的自同态环。在后文中我们会看到,它也是椭圆曲线的重要不变量。

我们称两条椭圆曲线C1, C2同构,如果存在态射ϕ : C1 → C2, ψ : C2 → C1,它们的复

合ϕ ψ和ψ ϕ都是恒等映射。态射ϕ和ψ都称为同构变换。通过同构变换,椭圆曲线的Weierstrass方程形式可以变成如下更简洁的形式(我们把

具体的计算留给读者):

y2 = x3 +Ax+B

定义椭圆曲线的判别式∆ = −16(4A3 + 27B2),j-不变量为j = −1728 (4A)3

∆ 。我们不

加证明地给出一个重要的结论:

命题3. C上的椭圆曲线C1和C2同构,当且仅当它们的j-不变量相等。

回忆命题2中℘和℘′的代数关系,其形式很像一个Weierstrass方程。对给定的格Λ,可

以构造一条椭圆曲线:

EΛ : y2 = 4x3 − g2x− g3

可以证明,EΛ的判别式∆(Λ) = g32 − 27g2

3非零,且EΛ和C/Λ按以下映射有复李群同构:

ϕ : C/Λ → EΛ

z 7→ [℘(z), ℘′(z), 1]

这里当℘′(z) =∞时对应的像是无穷远点。事实上,对任给的椭圆曲线E,也可以证明,存在格Λ,使得E = EΛ。现在我们想知

道的是,哪些格产生相同的椭圆曲线。

对格Λ1,Λ2和它们对应的椭圆曲线E1, E2,上述同构诱导了一个自然嵌入:

同源映射ϕ : E1 → E2 → 全纯函数ϕ : C/Λ1 → C/Λ2, ϕ(0) = 0

事实上,该嵌入是一个双射。而后一集合中函数的形式却很基本。一个构造方法是:

取α ∈ C使得αΛ1 ⊂ Λ2,那么“乘以α”是一个全纯同态。事实上,这也给出所有的全纯

同态。于是我们有如下推论:

推论1. 对格Λ1,Λ2和它们对应的椭圆曲线E1, E2,E1, E2同构当且仅当存在α ∈ C×,使

得αΛ1 = Λ2。

55

Page 59: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

在该结论中令E1 = E2 = E,即可研究环End(E)的具体形式。记E对应的一个格

为Λ,则立即有

End(E) ∼= α ∈ C : αΛ ⊂ Λ

对同构的椭圆曲线,其对应的格只相差一个常数因子,因此上式右端的环不依赖于格Λ的

选取。

可以明显地看出整数环Z是α ∈ C : αΛ ⊂ Λ的子环,此外,设Λ的一组Z-基

为ω1, ω2。我们有理由期待,将ω1旋转至ω2的α = ω2ω−11 也可能能满足αΛ = Λ。经计

算,有如下结论:

命题4. 设E是一条椭圆曲线,Λ是其对应的格,ω1, ω2为Λ的一组Z-基。那么以下两种情

况之一成立:

(i) 当ω2ω−11 不是虚二次代数数时,End(E) = Z;

(ii) 当ω2ω−11 是虚二次代数数时,End(E) = OD = Z[D+

√D

2 ],其中D是负整数,且D ≡0, 1 mod 4。此时,End(E)是Q的虚二次扩域Q(ω2ω

−11 )的子环,D是ω2ω

−11 所满足的整系

数二次方程Ax2 +Bx+ C = 0(gcd(A,B,C) = 1)的判别式。

下面这个命题告诉我们,拥有相同的自同态环的椭圆曲线不会太多:

命题5. 设R = OD如命题4中所定义。那么满足End(E) = R的椭圆曲线与R的类群(class

group)Cl(D)中的元素按如下方式一一对应:

E ←→ Λ

这里Λ是E对应的格,同时也被看作一个R-模。

类群是代数数论中的概念,R的类群的一种描述是:R上秩为1的全体投射模(在同构

意义下)组成的群。由于相差一个常数因子的R-模彼此同构,可以看出同构的椭圆曲线

的确对应到同一个等价类。代数数论中一个重要的结果是:对任意的负整数D,Cl(D)有

限。从而可以由命题5推出,拥有同一个自同态环的椭圆曲线也只有有限条。

4 j-函数在虚二次点处的取值

考虑以1和上半复平面的虚数τ ∈ H生成的格Λ(τ)。其对应的g2和g3均为τ的级数:

g2 = 60∑

(m,n)=(0,0)

(m+ nτ)−4, g3 = 140∑

(m,n)=(0,0)

(m+ nτ)−6

从而EΛ(τ)的j-不变量给出了一个τ的函数:

56

Page 60: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

j(τ) = 1728g32

g32 − 27g2

3

它被称为j-函数。

本节将利用椭圆曲线的性质,证明以下结论:

命题6. 若τ ∈ H是某个有理系数二次方程的根(此时称τ是一个虚二次点),那么j(τ)是Q上的代数数。

设τ是一个虚二次点,K = Q(τ) = Q(√D)是对应的Q的二次扩域,R = OD如命

题4中所定义。记E = EΛ(τ)。

任取σ ∈ Aut(C/Q)。以Eσ表示σ作用在E的Weierstrass方程系数上得到的新椭圆曲

线,即

Eσ : y2 = 4x3 − gσ2x− gσ

3

那么j(Eσ) = j(E)σ。

另一方面,注意End(E)中的元素其实都是态射,从而一定是有理函数。据此,

有End(Eσ) ∼= End(E) ∼= OD对任意σ ∈ Aut(C/Q)成立。于是椭圆曲线族Eσσ∈Aut(C/Q)中

只包含有限多个同构类,从而j(Eσ) : σ ∈ Aut(C/Q)=j(E)σ : σ ∈ Aut(C/Q)是有限集。故j(τ) = j(E)是Q上的代数数。

5 j-函数在实二次点处的“取值”

现代数论中研究的另一个重要内容源于SL2(Z)在H上的作用,该作用定义如下:

∀γ =

(a b

c d

)∈ SL2(Z),∀z ∈ H,规定γz =

az + b

cz + d

j-函数的一个重要性质就是其SL2(Z)-不变性。具体地说,我们有:

命题7. ∀γ ∈ SL2(Z),∀z ∈ H,成立j(γz) = j(z)。

特别地,令γ =

(1 1

0 1

),则命题给出j(z+ 1) = j(z),即j(z)是一个以1为周期的周

期函数。因此若令q = e2πiz,则可以写出j-函数的Fourier展开:

j(z) = q−1 + 744 + 196884q + 21493760q2 + · · ·

由此可以知道,当z沿虚轴正方向趋于无穷时,j(z)的值也趋于无穷。不严格地说,我们

承认j(i∞) =∞,并考虑j-函数的SL2(Z)-不变性,则可“推出”j-函数在实轴的有理点处

取值也均为∞。

57

Page 61: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

一个自然的问题是,j-函数在R的无理点处有取值吗?如果试图再次从SL2(Z)-不变

性的角度来考虑,将是不成功的。事实上,实数点所在的轨道只可能包含实数和无穷远

点,其中一条轨道即由无穷远点和所有有理数构成。换一个角度来说,我们的目标是找到

一个与j-函数有一定联系的函数,它在R上满足SL2(Z)-不变性。接下来我们就给出一种

实二次无理点处“取值”的选择。

设w是一个实二次无理数,其判别式disc(w) = D > 0。记Γ = SL2(Z),并令

Γw = γ ∈ Γ|γw = w

采用第3节命题4中的记号,记OD = Z[D+√

D2 ],以UD表示OD中范数为1的元素组成的乘

法群,即

UD = w ∈ OD|ww′ = 1

这里w′是w的共轭,亦即w,w′是同一整系数二次方程的两根。利用无穷下降法可以证明,

UD是一个无限阶循环群,其生成元记为ϵ = ϵD。

任取γ =

(a b

c d

)∈ Γw,按Γw的定义即有cw

2 + (d− a)w− b = 0,且w′是该方程的

另一根。另一方面,cw是一个代数整数,通过韦达定理计算得到

(a− cw)(a− cw′) = a2 − ac(w + w′) + c2ww′ = 1

即a− cw ∈ UD。

对给定的w,定义在Γw上的映射γ =

(a b

c d

)7→ (a − cw)2给出PSL2(Z)和U2

D的一

个同构。以γϵ表示ϵ2在Γw中的原像。对τ ∈ H,直接计算知成立

γτ − wγτ − w′ = (a− cw)2

τ − wτ − w′

特别地有

γϵτ − wγϵτ − w′ = ϵ2

τ − wτ − w′

以δ(w)表示w − w′的符号,则z = δ(w) τ−wτ−w′ ∈ H,并有如下关系:

γϵτ − wγϵτ − w′ = ϵ2δ(w)z

τ =w − δ(w)w′z1− δ(w)z

γwτ =w − ϵ2δ(w)w′z1− ϵ2δ(w)z

58

Page 62: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

利用j-函数的SL2(Z)-不变性,知道函数j(w−δ(w)w′z1−δ(w)z )在z 7→ ϵ2z作用下不变。再令z =

eu,则函数j(w−δ(w)w′eu

1−δ(w)eu )是在区域0 < Im(u) < π上全纯的、周期为2 log ϵ的函数,从而它

有如下形式的Fourier展开式:

j(w − δ(w)w′eu

1− δ(w)eu) =

∞∑

n=−∞ane

2πin u2 log ϵ

利用Fourier级数的性质,就可定义我们想要的函数了。

定义6. 对实二次无理数w,定义val(w)的值为(1)中Fourier级数常数项,即

val(w) = a0 =1

2 log ϵ

∫ σ0+2 log ϵ

σ0

j(w − δ(w)w′eu

1− δ(w)eu)du (1)

其中σ0是满足0 < Im(σ0) < π的任一复数。

令σ0 = πi/2− log ϵ,并作变量代换u 7→ u+ πi/2,得到一个看起来更舒服的表达:

val(w) =1

2 log ϵ

∫ log ϵ

− log ϵj(w − δ(w)w′ieu

1− δ(w)ieu)du (2)

函数val(w)确实有我们想要的基本性质,同时val(w)和val(w′)之间也有关系:

命题8. 函数val(w)满足:

1) 若w、w1在SL2(Z)作用下等价,则val(w) = val(w1)。

2) val(w) = val(w′)

3) val(w) = val(−w′)

D不大时,很多情况下val(w)的值都是实数:

命题9. 设disc(w) = D。若ϵD的范数为−1,则val(w) ∈ R。

关于val的取值,有一些猜想:

猜想1. minval(w) ∈ R = val(1+√

52 ) = 706.342813 . . .。

猜想2. val(w)的虚部在(−1, 1)之间取值。其分布关于0对称,且随绝对值增大而减少。

本文最后主要描述val(w)函数和Markoff数之间的一些猜想。首先从一个数学分析中

熟悉的练习开始:

命题10. 对任意的实无理数α,存在无穷多个有理数p/q,使得|α− pq | < 1√

5q−2成立。

59

Page 63: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

图 1 val(w)虚部取值的分布,d于20000附近取值,约15000个数据

该命题中, 1√5是最佳值。但是只需要去掉一类很少的数,就可以将其再改进。定

义R上的等价关系∼为:

x ∼ y ⇐⇒ ∃a, b, c, d ∈ Z, ad− bc = 0, y =ax+ b

cx+ d

那么成立如下命题:

命题11. 对任意的实无理数α 1+√

52 ,存在无穷多个有理数p/q,使得|α−

pq | < 1

2√

2q−2成

立。

事实上,存在一列无理数θ1, θ2, . . .和L1, L2, . . . ∈ R,使得如下命题成立:

命题12. 对任意的实数α θ1, θ2, . . . , θn−1,存在无穷多个有理数p/q,使得|α − pq | <

L−1n q−2成立。

数列θi和Li其实是由一个数列mi = 1, 2, 5, 13, 29, 34, 89, 169, 194, 233, 433, . . .决定的。该数列被称为Markoff数列,下文我们描述性地给出其生成方式。

该数列围绕着方程

x2 + y2 + z2 = 3xyz (3)

展开。数列前三项(1, 2, 5)是(3)的一组解。注意到(3)关于每个变元都是首一的二次方程,

故对(3)的任意一组解(x0, y0, z0),存在x′, y′, z′,使得(x′, y0, z0),(x0, y

′, z0),(x0, y0, z′)均

为(3)的解。根据该方程的形式,容易知道,若x0, y0, z0均为正数,则x′ = x0, y

′ = y0, z′ =

z0成立。故从最小的正整数解(1, 2, 5)出发,可以构造出很多其它的解。构成这些解的所

有整数由小到大排列,即组成了数列mi。我们可以把这个生成解的过程用下图直观地表示出来。图中一个顶点附近的三个数构成(3)的一组解:

然后就可以严格地定义Li和θi如下:

Li =

√9− 4

m2i

, θi =−3mi + 2ki +

√9m2

i − 4

2mi

60

Page 64: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

图 2 Markoff数列的树状图

其中ki是满足aiki ≡ bi(mod mi)的整数,(ai, bi,mi)是(3)的一组解,且mi是三者中最大

的。

最后叙述三个与Markoff数列的树状图关系密切的猜想,以结束本文:

猜想3. i ≥ 3时,val(θi)的值均非实数。

猜想4. 在Markoff数列的树状图中选定一个顶点,设其邻近三个区域对应的数分

别为m,m′,m′′,且m = 5对应“最靠下”的区域。以θ, θ′, θ′′记m,m′,m′′ 对应的θ值,

则val(θ)的虚部值在val(θ′)和val(θ′′)之间。

在树状图中,任一Markoff数m对应的区域边界包含两条射线(只有1和2是特例,它

们仅有一条射线)。有无穷多个区域与m以左侧的射线为公共边界,由上至下排列,它们

对应的Markoff数列的子列记为mLk ,相应地,与m以右侧的射线为公共边界的区域对应

的Markoff数列的子列记为mRk 。m,mL

k ,mRk 对应的θ值记为θ,θL

k ,θRk 。

猜想5.

limk→∞

val(θLk ) = val(θ), lim

k→∞val(θR

k ) = val(θ)

6 结语

本文的目的是向本科低年级的同学们介绍现代数论的相关知识。在笔者个人的数论兴

趣发展中,椭圆曲线一直在提供很多有趣而又相对易懂的信息。刚进入大学时,椭圆曲线

的加法群律令笔者惊奇。在大三开始前的暑假,笔者于校内旁听东亚数论会议,初次了解

到现代数论的问题和研究方法。本文第5节的内容即是基于当时金子昌信教授的讲稿[3]整

理而成,其演讲给笔者留下了深刻印象。一年后,笔者参加清华学生自己组织的椭圆曲线

讨论班,主讲[1]中C上的椭圆曲线一章,这些内容构成了本文的第2、3节。第4节则主要

来自于清华数学中心暑期学校“Introductions to Automorphic Forms”课程晚间讨论课。

笔者希望,个人的这些美好回忆,能够鼓励更多的同学去了解现代数论。

61

Page 65: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

参考文献

[1] J.H.Silverman, The Arithmetic of Elliptic Curves, GTM 106.

[2] T.M.Apostol, Modular Forms and Dirichlet Series in Number Theory, GTM 41.

[3] Masanobu Kaneko, “Observations on the “values” of the modular j-function at real

quadratics”, 演讲幻灯片。

数学名言

学习科学不是靠读,而是靠理解。科学不是静止呆板的字母,书籍不能保证她永恒的

青春。科学是一种有生命的思想,为了对她产生兴趣,进而掌握她,人们必须在精明的人

的指导下,用自己的头脑去重新发现她。

——J. Leray

62

Page 66: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

A glimpse at the Jacobi ϑ-function

Di Yang∗

1 Introduction

The Jacobi ϑ-function is an entire function on the complex z−plane, defined by1

ϑ(z; t) =∞∑

n=−∞e−n2π2t+2πinz (z ∈ C), (1)

where t is a complex parameter satisfying Re(t) > 0. The series converges absolutely and

uniformly in any bounded region of the z-plane, thus for any fixed t, ϑ(z; t) is an entire

function of z.

Historically, this entire function first appeared in Fourier’s research on the conduction

of heat (See [1], pp. 263). From the time of Riemann, it began and kept playing crucial

roles in the studies of Riemann’s ζ−function, linear PDEs and elliptic functions, and in

various branches of mathematics, such as analytic number theory, integrable systems and

complex algebraic geometry.

In this short note, we focus on the following well-known identity of ϑ :

ϑ(z; t) =e−z2/t

√πt

ϑ( z

iπt;

1

π2t

). (2)

It is easy to check that identity (2) is just

∞∑

n=−∞e−(z+n)2/t =

√πt

∞∑

k=−∞e−π2k2t+2πikz, (3)

where Re(t) > 0 and z ∈ C. There are many proofs of this identity and we will discuss

a formal but interesting one. By applying identity (3), we will present a regularization of

∗PhD08-student, Supervisor: Professor Youjin Zhang1There are several different but essentially the same definitions of ϑ−functions depending on different

choices of independent variables, e.g. ϑ(z; t) is just ϑ3(2πz; e−π2t) in Whittaker and Watson’s classical

book [3].

63

Page 67: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

Riemann’s ζ−function following Riemann’s original ideas. Most derivations that we use

can be found in Bellman’s book [2].

2 From heat equation to ϑ: A formal proof of identity (3)

We consider the following initial boundary value problem (IBVP) of the heat equation:

ut = uxx, (t > 0, −1/2 < x < 1/2), (4a)

u(x, 0) = δ(x), (−1/2 < x < 1/2), (4b)

u(−1/2, t) = u(1/2, t), (t > 0). (4c)

Here, δ(x) is the Dirac δ−function2. By using the method of variable separations, one can

obtain the formal solution of IBVP (4):

u(x, t) = 1 + 2

∞∑

n=1

e−4n2π2t cos (2nπx) =

∞∑

n=−∞e−4n2π2t+2πinx, (5)

where t > 0, −1/2 ≤ x ≤ 1/2. By the periodic extension in x, we find u(x, t) is just

ϑ(x; 4t), x ∈ R, t > 0.

The solution of IBVP (4) can also be constructed through employing the heat kernel.

Indeed, consider the following initial value problem (IVP):

wt = wxx, (t > 0, −∞ < x < ∞), (6a)

w(x, 0) = δ(x), (−∞ < x < ∞), (6b)

w(−∞, t) = w(∞, t), (t > 0). (6c)

The solution of this IVP is the heat kernel function, given by

w =1

2√

πte− x2

4t . (7)

Let

v(x, t) =∞∑

n=−∞w(x + n, t).

We find that v satisfies the heat equation as well as the initial-boundary conditions of (4).

As a result, we confirm that formally u(x, t) = v(x, t), i.e.,

∞∑

n=−∞e−4n2π2t+2nπix =

1

2√

πt

∞∑

n=−∞e− (x+n)2

4t (x ∈ R, t > 0),

2Since our proof is formal, we also write a formal version of the boundary value problem.

64

Page 68: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

which is equivalent to (3).

Remark 2.1 The heat kernel can be produced from the constant solution being acted by

a non-trivial symmetry as well as a time translation [4].

Remark 2.2 Identity (3) can be proved rigorously by the Poisson summation formula.

In [5], the same method was employed to the fractional heat equation, where some

new identities were discovered and formally proved, such as

∞∑

n=−∞E

2/31 (−n2π2t) = 32/3t−1/2 ·

∞∑

n=−∞Ai(2n · 3−1/3t−1/2), (8)

where E2/31 is a Mittag-Leffler function and Ai is the first Airy’s function.

3 Application

There are several applications of identity (3). The most interesting one is that equa-

tion (3) leads to a regularization of Riemann’s ζ−function. First, we take z = 0 in identity

(3):∞∑

n=−∞e−n2/t = t1/2√π

∞∑

k=−∞e−π2k2t. (9)

Let t → t2/π and (9) becomes

1 + 2

∞∑

n=1

e−n2π/t2 = t(1 + 2

∞∑

k=1

e−πk2t2)

(Re(t2) > 0). (10)

Let g(t) =∑∞

n=1 e−n2πt2 ; we find

2g(t) =1

t− 1 +

2

tg(1

t

). (11)

Applying∫ 10 ·ts−1dt to (11) and noticing

∫ ∞

0g(t)ts−1dt =

Γ(s/2)ζ(s)

2πs/2, (12)

we obtainΓ(s/2)ζ(s)

πs/2=

1

s − 1− 1

s+ 2

∫ ∞

1(ts−1 + t−s)g(t)dt, (13)

which gives a regularization of ζ(s) on the complex s-plane. Since 1/Γ(s/2) is an entire

function [6] with simple zeros s = 0, −2, −4, ..., we find that ζ(s) has only one singularity

65

Page 69: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

which is a simple pole at s = 1 with residue 1. It is interesting that RHS of (13) is

invariant with respect to transformation s → 1 − s and this gives the following identity

Γ(s/2)ζ(s)

πs/2=

Γ((1 − s)/2)ζ(1 − s)

π(1−s)/2. (14)

Remark 3.1 The elegant formulas (13) and (14) were originally derived by Riemann [2]

and this is his second method working out the analytic continuation of ζ. Due to identity

(14), Riemann made his famous hypothesis.

4 Discussions

Following Bellman’s book [2], we proved formally the transformation formula (2) of

the Jacobi ϑ function. By using this formula, we presented one of Riemann’s original

methods for the analytic continuation of Riemann’s ζ− function. It is interesting that

the formal proof of equation (2), basing on solving a boundary value problem of the heat

equation, is actually from physics.

We would like to make some further discussions on the relation between mathematics

and physics. It is well-known that mathematics plays an important role in physics: The

former not only provides fundamental tools but also brings a lot of applications to the

latter.

However, it is also found that physics helps a lot developing mathematics and solving

pure mathematical problems. This is an interesting character and even a true meaning

of the modern branch mathematical physics (MP). Besides our illustrious example, there

are a lot of more interesting examples. A famous one is the application of solutions of

the Yang-Mills equations into the structure of four dimensional manifolds. This beautiful

contribution was made by Donaldson et al [7]. One could imagine that without the dis-

covery of the Yang-Mills equations by physicists, several problems on the structure of four

dimensional manifolds may keep open for a longer time.

So in MP, problems considered are mathematical, but methods and tools employed

are related to physics. This is also very natural. Indeed, some mathematical problems

themselves are hard to solve, even hard to describe, but after transforming or relating it

to physics, they become simple.

Besides this important character of MP, namely the ‘re-action’ of physics to math-

ematics, MP also provides the role of connecting a lot of math branches, the concept of

which is usually called duality. And this is beyond our present discussions.

66

Page 70: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

References

[1] J. Fourier, Analytical theory of heat, translated by A. Freeman, Cambridge: The

University Press, 1878.

[2] R. Bellman, A brief introduction to Theta functions, Holt, Rinehart and Winston,

Inc, 1961.

[3] E. T. Whittaker, G. N. Watson, A course of modern analysis, 4th edtion, Cambridge

University Press, 1927.

[4] P. J. Olver, Applications of Lie groups to differential equations, 2nd edition, Springer,

1993.

[5] D. Yang, A note on a generalization of the ϑ-function and corresponding summation

formulas, private note, 2010.

[6] E. M. Stein, R. Shakarchi, Complex Analysis, Princeton University Press, 2003.

[7] http://en.wikipedia.org/wiki/Simon donaldson.

67

Page 71: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

从1 + 2 + · · · + 100 = 5050谈起: 第二部分

周坚∗

本文第一部分介绍从差分的角度来求幂和公式,现在介绍从微积分的角度来解决这个

问题, 思想完全来源于Euler [2]。本文参考潘承洞、潘承彪两位先生所著的《解析数论基

础》第二章“求和公式”中Euler-MacLaurin求和公式的部分。现在这个求和公式一般出

现在数值分析的教科书中,通常的数学分析教科书不介绍了,但是在较老的如菲赫金哥尔

茨写的微积分学教程中可以找到。

1. 将求和联系到求积分.

假设f : [0, ∞) → R是一个无穷阶连续可导函数, N为一正整数, 假设我们想要求和式:

N∑

k=1

f(k).

将函数的图像画出来后,这个和式的几何意义就显现出来来了:它与∫ N0 f(x)dx相差的

是N个曲边三角形的面积。为了使误差更小,我们可以用梯形法:估计

1

2(f(k − 1) + f(k)) −

∫ k

k−1f(x)dx.

2. 梯形法的误差估计.

我们先来估计12(f(0) + f(1)) −

∫ 10 f(x)dx. 由Newton-Leibnitz公式,

∫ 1

0f(x)dx =

∫ 1

0f(x)d(x − 1

2) = (x − 1

2)f(x)

∣∣∣∣1

0

−∫ 1

0(x − 1

2)f ′(x)dx

=1

2(f(0) + f(1)) −

∫ 1

0b1(x)f ′(x)dx.

此处b1(x) = x − 12 . 所以有:

1

2(f(0) + f(1)) =

∫ 1

0f(x)dx +

∫ 1

0b1(x)f ′(x)dx. (1)

∗清华大学数学系基础数学研究所教授

68

Page 72: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

从使用Newton-Leibnitz公式的角度上来讲,b1(x)的性质是:

b′1(x) = 1, (2)

所以必有某常数c1使得b1(x) = x + c1。该常数由以下条件确定:

∫ 1

0b1(x)dx = 0. (3)

如果取常数c1 = 0 (这当然是最自然的选择), 则得到:

∫ 1

0f(x)dx = xf(x)

∣∣10−

∫ 1

0xf ′(x)dx = f(1) −

∫ 1

0xf ′(x)dx.

如果取常数c1 = 1, 则得到:

∫ 1

0f(x)dx =

∫ 1

0f(x)d(x − 1) = (x − 1)f(x)

∣∣10−

∫ 1

0(x − 1)f ′(x)dx

= f(0) −∫ 1

0(x − 1)f ′(x)dx.

这两个选择都是在估计矩形法的误差。

下面用同样的想法继续估计∫ 10 b1(x)f ′(x)dx. 找一个二阶多项式b2(x)满足

b′2(x) = b1(x), (4)

其常数项由以下条件确定: ∫ 1

0b2(x)dx = 0. (5)

则有 ∫ 1

0b1(x)f ′(x)dx = b2(1)f ′(1) − b2(0)f ′(0) −

∫ 1

0b2(x)f ′′(x)dx. (6)

因此递归地定义一列多项式bn(x), 使得

b′n(x) = bn−1(x), n ≥ 2, (7)

∫ 1

0bn(x)dx = 0. (8)

从它们可以得到:

∫ 1

0bn(x)f (n)(x)dx = bn+1(1)f (n)(1) − bn+1(0)f (n)(0) −

∫ 1

0bn+1(x)f (n+1)(x)dx. (9)

69

Page 73: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

由这些等式可以得到:

1

2(f(0) + f(1)) =

∫ 1

0f(x)dx +

n∑

j=2

(−1)j(bj(1)f (j−1)(1) − bj(0)f (j−1)(0))

+(−1)n+1

∫ 1

0bn(x)f (n)(x)dx.

(10)

3. 多项式列bn(x)的研究. 注意到b1(x) = x − 12恰为第一个Bernoulli多项式B1(x)!经过计

算得到:

b2(x) =1

2x2 − 1

2x +

1

12=

1

2!B2(x),

b3(x) =1

6x3 − 1

4x2 +

1

12x =

1

3!B3(x),

b4(x) =1

24x4 − 1

12x3 +

1

24x2 − 1

720=

1

4!B4(x).

因而可以猜想

bn(x) =1

n!Bn(x). (11)

作为一个很好的练习, 这可以从Bernoulli多项式的生成函数公式

∞∑

n=0

Bn(x)

n!tn =

text

et − 1(12)

推出来。特别地,

bj(0) =Bj

j!=

B2n(2n)! , j = 2n,

0, j = 2n − 1, n > 1(13)

bj(1) =

Bj

j! , j = 1,

12 j = 1.

(14)

于是,

1

2(f(0) + f(1)) =

∫ 1

0f(x)dx +

n∑

j=1

B2j

(2j)!(f (2j−1)(1) − f (2j−1)(0))

−∫ 1

0b2n(x)f (2n)(x)dx.

(15)

4. Euler-MacLaurin求和公式.

70

Page 74: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

现在将bj(x)以1为周期延拓到(−∞, +∞). 于是对每个正整数k, 有

1

2(f(k − 1) + f(k)) =

∫ k

k−1f(x)dx

+

n∑

j=1

B2j

(2j)!(f (2j−1)(k) − f (2j−1)(k − 1)) −

∫ k

k−1b2n(x)f (2n)(x)dx.

(16)

取k = 1, . . . , N后将这些式子加在一起可以得到:

N∑

k=1

f(k) = −1

2f(0) +

1

2f(N) +

∫ N

0f(x)dx

+n∑

j=1

B2j

(2j)!(f (2j−1)(N) − f (2j−1)(0)) −

∫ N

0b2n(x)f (2n)(x)dx.

(17)

取k = 2, . . . , N后将这些式子加在一起可以得到:

N∑

k=1

f(k) =1

2f(1) +

1

2f(N) +

∫ N

1f(x)dx

+

n∑

j=1

B2j

(2j)!(f (2j−1)(N) − f (2j−1)(1)) −

∫ N

1b2n(x)f (2n)(x)dx.

(18)

这两个公式是Euler-MacLaurin求和公式。我们可以用它们重新推导第一部分的各种公

式。

5. 幂和公式

取f(x) = x2m. 由于f (2j−1)(x) = (2j)!2m+1

(2m+1

2j

)x2m−2j+1,

N∑

k=1

k2m =1

2N2m +

1

2m + 1N2m+1 +

m∑

j=1

1

2m + 1

(2m + 1

2j

)B2jN

2m−2j+1.

取f(x) = x2m−1. 由于f (2j−1)(x) = (2j)!2m

(2m2j

)x2m−2j ,

N∑

k=1

k2m−1 =1

2N2m−1 +

1

2mN2m +

m∑

j=1

1

2m

(2m

2j

)B2jN

2m−2j .

将这两种情况统一就得到第一部分中的结果。

6. 倒数和公式

71

Page 75: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

取f(x) = 1x . 由于f (2j−1)(x) = −(2j − 1)!x−(2j), f (2j)(x) = (2j)!x−(2j+1),

N∑

k=1

1

k− log N =

1

2+

1

2N−

n∑

j=1

B2j

2j

1

N2j+

n∑

j=1

B2j

2j

−∫ N

1(2n)!b2n(x)

1

x2n+1dx

=1

2

1

N−

n∑

j=1

B2j

2j

1

N2j+

∫ ∞

N(2n)!b2n(x)

dx

x2n+1

+1

2+

n∑

j=1

B2j

2j−

∫ ∞

1(2n)!b2n(x)

dx

x2n+1

在等式两边同取limN→∞后得:

γ =1

2+

n∑

j=1

B2j

2j−

∫ ∞

1(2n)!b2n(x)

dx

x2n+1, (19)

所以,N∑

k=1

1

k− log N = γ +

1

2

1

N−

n∑

j=1

B2j

2j

1

N2j+

∫ ∞

N(2n)!b2n(x)

dx

x2n+1. (20)

7. 负幂和公式.

设m为一个≥ 2的整数。取f(x) = x−m. 由于f (j)(x) = j!(−m

j

)x−m−j = (j+1)!

−m+1

(−m+1j+1

)x−m−j ,

N∑

k=1

1

km=

1

2+

1

2Nm+

1

m − 1− 1

m − 1

1

Nm−1+

n∑

j=1

B2j

−m + 1

(−m + 1

2j

)(

1

Nm+2j−1− 1)

−∫ N

1b2n(x)

(2n + 1)!

−m + 1

(−m + 1

2n + 1

)1

x2n+mdx

= − 1

m − 1N−m+1 +

1

2N−m +

n∑

j=1

1

−m + 1

(−m + 1

2j

)B2jN

−m−2j+1

+

∫ ∞

Nb2n(x)

(2n + 1)!

−m + 1

(−m + 1

2n + 1

)dx

x2n+m

+1

2+

1

m − 1−

n∑

j=1

B2j

−m + 1

(−m + 1

2j

)−

∫ ∞

1b2n(x)

(2n + 1)!

−m + 1

(−m + 1

2n + 1

)dx

x2n+m.

令N → ∞可得:

ζ(m) =1

2+

1

m − 1−

n∑

j=1

B2j

−m + 1

(−m + 1

2j

)−

∫ ∞

1b2n(x)

(2n + 1)!

−m + 1

(−m + 1

2n + 1

)dx

x2n+m.

72

Page 76: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

所以,

N∑

k=1

1

km= ζ(m) − 1

m − 1N−m+1 +

1

2N−m +

n∑

j=1

1

−m + 1

(−m + 1

2j

)B2jN

−m−2j+1

+

∫ ∞

Nb2n(x)

(2n + 1)!

−m + 1

(−m + 1

2n + 1

)dx

x2n+m.

8. 结语。

以上的方法并没有解决求出∑∞

k=11k2或更一般的,

∑∞k=1

1k2m的问题。Euler本人给出

的方法是考虑无穷乘积公式:

sin z = z

∞∏

n=1

(1 − z2

n2π2). (21)

两边取对数后取导数得:cos z

sin z=

1

z−

∞∑

n=1

2zn2π2

1 − z2

n2π2

. (22)

所以有

zcos z

sin z= 1 − 2

∞∑

n=1

z2

n2π2

1 − z2

n2π2

= 1 − 2∞∑

n=1

∞∑

m=1

z2m

n2mπ2m= 1 − 2

∞∑

m=1

z2m

π2m

∞∑

n=1

1

n2m.

等式左边可以做如下的变形:

zcos z

sin z= iz

eiz + e−iz

eiz − e−iz= iz +

2iz

e2iz − 1

= 1 +

∞∑

m=1

B2m

(2m)!(−1)m22mz2m.

因此,

ζ(2m) =

∞∑

n=1

1

n2m= (−1)m−122m−1 B2m

(2m)!π2m. (23)

Euler的方法可以通过复分析严格化(参看[1])。另一种计算方法是使用Fourier分析。参

看[4, p.p. 26-27]。由于bn(x)为周期为1的函数,考虑它们的Fourier级数得:

b1(x) = −∞∑

n=1

1

nπsin(2nπx), (24)

b2m(x) = (−1)m−1∞∑

n=1

2

(2nπ)2mcos(2nπx). (25)

73

Page 77: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

令x = 0后得:

b2m(0) = (−1)m−1∞∑

n=1

2

(2nπ)2m. (26)

故∞∑

n=1

1

n2m= (−1)m−122m−1π2mb2m(0) = (−1)m−122m−1 B2m

(2m)!π2m. (27)

参考文献

[1] L. V. Ahlfors, Complex analysis, Beijing Machine Press, McGraw-Hill, 2004.

[2] L. Euler, Foundations of differential calculus, English translation of Latin version ,

Insitutiones Calculi Differentialis, Chapters 1 to 9, Springer, 2000.

[3] A. Knoebel, R. Laubenbacher, J. Lodder, D. Pengelley, Mathematical Masterpieces:

Further Chronicles by the Explorers, Springer, 2007.

[4] 潘承洞,潘承彪,解析数论基础,科学出版社,1999。

数学笑话

质数的证明

证明所有大于2的奇数都是质数,不同专业的人给出不同的证明:

数学家:3是质数,5是质数,7是质数,由数学归纳可知,所有大于2的奇数都是质

数。

物理学家:3是质数,5是质数,7是质数,9是实验误差,11是质数,……

工程师:3是质数,5是质数,7是质数,9是质数,11是质数,……

计算机程序员:3是质数,5是质数,7是质数,7是质数,7是质数,……

统计学家:让我们来试几个随机抽取的数,17是质数,23是质数,11是质数,……

74

Page 78: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

希尔伯特和闵可夫斯基对

爱因斯坦如何看待物理与数学之关系的影响∗

Leo Corry†

概要 在其科学生涯的早期,阿尔伯特·爱因斯坦(Albert Einstein)认为,数学仅仅

是为物理直观服务的工具而已。然而之后的若干年,他逐渐意识到数学其实是科学创

造力的本源。他的观念之所以会发生这种变化,主要是受到了两位杰出的德国数学家

的影响:大卫·希尔伯特(David Hilbert)和赫尔曼·闵可夫斯基(Hermann Minkowski)。

1 引言

在近些年来的历史研究中人们发现,若想更好地理解爱因斯坦在当时的特定环境中的

科学生涯,必须要注意到两个不同因素之间的相互联系与统一性:其一是一些深层次的变

化逐渐影响着最基本的科学观;其二是他与同事、朋友及批评者的不断接触,对他观念的

演变产生了不可估量的影响。

影响爱因斯坦科学观的最深远的变化之一,便是他对于物理与数学相互关系的看法:

最初,他认为物理直观是他的研究的指路灯,而数学只是一个空洞的工具而已;然而后来

他又认为,数学才是知识的源泉及精华所在[1]。造成这个重要变化的原因是多种多样且

十分复杂的,在本文中难以将它们一一介绍。本文的目的仅仅是对爱因斯坦与其他科学家

的接触对其科学观(特别是在如何看待物理与数学的关系方面)的影响进行一些有意义

的阐述。这里要介绍的是两位当时最杰出最有影响力的数学家——大卫·希尔伯特和赫尔曼·闵可夫斯基。

∗本文为译者2009–2010春季学期数学史课程的期末论文,前几部分为对原始论文的翻译,最后一部分为

译者看过之后的感想。†Tel Aviv University

75

Page 79: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

2 爱因斯坦对于数学及物理的看法的逐步改变

1933年6月,爱因斯坦在牛津大学的斯宾塞讲座(Herbert Spencer lecture)中发言。

在阐述“理论物理的方法”的过程中,他讲到:

“假设理论物理的一些最基本的原理无法从经验中获得,而必须由我们自由地创造出

来,那我们有没有可能找到那条正确的道路呢?……我会毫不犹豫地回答,至少在我看

来,正确的道路是存在的,并且我们也有能力找到它。到目前为止,我们的经验使我们相

信,自然界中的各种现象是靠一些最显而易见的数学原理来实现的。因此我相信,那些能

够解释自然现象的基本物理概念及将这些概念联系在一起的物理定律,是可以通过纯数

学的方法来找到的。……当然了,实际观测仍然是检验那些数学模型的物理功效的唯一标

准。但是那些富有创造性的原理仍然扎根于数学之中。”[2]

对于爱因斯坦来说,这个声明可不仅仅是说说而已。这段话实际上是对他当时进行物

理研究所使用方法的真实写照。从1922年起一直到他生命的终结,爱因斯坦一直致力于找

到一个可以建立起整个物理学基础的大统一场论。爱因斯坦的探索正是源于上面那段话中

所表达的一种信仰,即对数学的创造力及其在探索自然过程中的基础地位的信仰。不幸的

是,这种探索不仅没有产生实际的值得铭记的结果,还使得爱因斯坦与当时物理界的主流

渐行渐远。

然而,毫无疑问,在1920年之前爱因斯坦本人也会坚决反对上文所说的那种信仰。对

数学的蔑视是爱因斯坦的学生时代及早年的研究生涯的一个鲜明特点:他认为数学仅仅是

为物理观点进行服务的工具,并且他也只学足以满足他当前研究需要的那些数学。他不信

任数学技巧,并且不断地表达出他对纯粹的形式推演的厌恶,认为那些与“真正的物理”背

道而驰。从很多有记录的事例中都可以看到他的这种观念,其中经常被引用(并且时间上

也较晚)的一个发生在他与克莱因(Felix Klein)在1917年的交往中。当时克莱因用数学

方法来处理广义相对论的方程。爱因斯坦在给克莱因的信中写道:

“在我看来,你过高地估计了形式推导的价值。只有在一个已经被发现的真理需要一

个方程作为其最终的表达形式时,那些东西才是有价值的,但它们几乎没有任何启发性价

值。”[3]

很明显,造成这种观念发生根本性改变的一个重要因素,是他在1912∼1915年探索相

对论中的引力理论时步履维艰[4]。爱因斯坦在这项研究中感到物理与数学因素相互交织,

难以分离[5]。里奇(Gregorio Ricci-Curbastro)和列维-奇维塔(Tullio Levi-Civita)的所

谓“绝对微分学”,这给爱因斯坦留下了极为深刻的印象。尽管如此,直到若干年后,他才

彻底相信纯数学可以支配物理理论的发展。与之相对比的是,在希尔伯特及闵可夫斯基的

带领下,这种观念一直是当时哥廷根的科学工作的主要哲学基础之一。

76

Page 80: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

3 希尔伯特与闵可夫斯基在哥廷根

大卫·希尔伯特(David Hilbert)是20世纪初最有影响力的数学家,同时,他大概是

最后一位通才(universalist)。他是在1895年由菲利克斯·克莱因(Felix Klein)带到了哥

廷根。克莱因承诺要把哥廷根建成世界数学及科学的中心。在此之前的1880年至1895年

间,希尔伯特的学生时代及早期数学生涯是在他的故乡哥尼斯堡1度过的。哥尼斯堡城有

一所很小的大学,却在数学及物理学(特别是理性力学方面)的教育和研究方面有着令人

敬佩的优良传统,这种传统最初是在19世纪前半期由卡尔·雅克比(Carl Gustav Jacobi)

和弗朗茨·诺依曼(Franz Ernst Neumann)建立的。在那里学习的最初几年,希尔伯特听了

著名数学家海因里希·韦伯(Heinrich Weber)的演讲。韦伯在多项式方程理论、椭圆函

数、数学物理等许多领域都有着广泛的兴趣。

在哥尼斯堡的时光里,对希尔伯特的精神视野产生最深刻的影响的,是他与另外两

位年轻数学家之间不同寻常的关系:他老师和同事阿道夫·赫维茨(Adolf Hurwitz),以及

较为年轻的赫尔曼·闵可夫斯基。作为一名学生,闵可夫斯基先在在波恩(Bonn)学习了三

个学期,之后又于1885年在哥尼斯堡拿到博士学位。毕业后他回到波恩,成为一名无薪大

学教师2。他在波恩一直呆到1894年,之后来到苏黎世教书。爱因斯坦便是他的学生之一。

直到1902年,克莱因成功说服普鲁士教育当局破例给予闵可夫斯基数学教授的职位,他才

到哥廷根投奔希尔伯特。

希尔伯特和闵可夫斯基的主要兴趣都是在纯数学方面,但又绝对不是仅限于此。他

们也经常留意着物理学的最新进展。在希尔伯特苦心经营他的公理化理论,并于1899年

发表了那部著名的《几何基础》(Grundlagen der Geometrie)第一次对这个理论做了成

熟的阐述的同时,他脑中思索的物理学问题一点都不少于几何问题。事实上,希尔伯

特在1900年对物理学公理化的涉足具体地反映了他的思想,而物理学公理化也成为了

他提出的23个问题之一。闵可夫斯基对物理学的热情很大程度上是在由波恩期间同赫

兹(Heinrich Hertz)的交往激发的,而他的这种热情同时也是希尔伯特对物理学的兴趣的

主要来源之一[6]。

希尔伯特和闵可夫斯基,以及一大批他们在哥廷根的同事及学生,在涉足物理学问题

时,都有一个主要的哲学观念,那就是对一种“数学与物理之间的预知的和谐关系”的信

仰。这种观念在德国知识界有很深的根源,而又在哥廷根被复兴了[7]。我们发现希尔伯

特及闵可夫斯基的许多演讲都明确地涉及了这种观念。同时我们也不难看到,这种观念使

得哥廷根的许多研究之间存在着哲学思想上的统一性。自然,它也为“将物理留给物理学

家来做实在太难了”的想法——这在当地数学家中十分普遍——提供了论据。这种观念还

1Konigsberg,即现在俄罗斯的加里宁格勒,位于波罗的海海岸,当时属东普鲁士。——译者注2德语为Privatdozent,报酬直接来自学生的大学教师。——译者注

77

Page 81: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

使得人们相信,数学技巧才是解开自然之谜的那把金钥匙。

乍看之下,很明显闵可夫斯基和希尔伯特分别独立地参与了狭义相对论和广义相对论

的发展。然而,如果我们注意到当时哥廷根数学圈的中心让位于物理学理论的研究这个背

景,就会发现这完全不是巧合。

4 闵可夫斯基和狭义相对论

刚到哥廷根,闵可夫斯基就积极参与到希尔伯特的所有学术活动中,包括当时他正感

兴趣的物理学公理化问题[8]。1905年,希尔伯特、闵可夫斯基以及一些其他的哥廷根教

授共同组成了一个高级研究小组,研究有关电子的理论的最新进展[9]。1907年,两人又

带领了一个研究电动力学方程的联合研究小组。从那年开始一直到1909年去世,闵可夫斯

基将他的精力全部投入到了对电动力学方程及相对论的研究中。

闵可夫斯基从四维时空流形的角度,对爱因斯坦的狭义相对论进行了重新表达。注意

到量

x2 + y2 + z2 − (ct)2 (c代表真空中的光速)

在线性正交变换下的不变性,闵可夫斯基的方法为狭义相对论提供了一种优美简洁的表

达。但闵可夫斯基的表述更像是纲领性的而不是系统性的。它强调了一种可能性,那就是

从数学原理本身出发就可以得到狭义相对论的核心结论,而不需要依赖任何实验。狭义相

对论的实质是力学和电动力学之间的一种深层次且出人意料的统一,而闵可夫斯基在该理

论上的这种成就无疑加固了对“数学与物理之间的预知的和谐关系”的信仰。

闵可夫斯基的形式化表述的重要性立刻被一些物理学家注意到了,如马克斯·冯·劳厄(Max von Laue)和阿诺尔德·索末菲(Arnold Sommerfeld)。索末菲以前是克莱因的学

生,因此他自己的思想也和哥廷根学术圈类似。1910年,他发表了两篇文章,用比较系统

的方式详细阐述了闵可夫斯基的理论,这在之后的很多年中成为了物理学家参考的标准文

献[10]。劳厄在1911年出版了第一部介绍狭义相对论的教科书[11]。由于对闵可夫斯基的

方法的使用,该书表述狭义相对论的技巧及简洁程度超过了爱因斯坦的原始版本。

然而,爱因斯坦本人对闵可夫斯基的工作的反应与上面那些人迥异。事实上,这是他

早年对物理与数学之关系的态度的典型表现。爱因斯坦早在苏黎世上学时就认识闵可夫斯

基了,一直对他抱有矛盾的看法:爱因斯坦一方面排斥闵可夫斯基的高级数学课程,另一

方面又十分欣赏他在分析力学方面的高水平演讲。对于闵可夫斯基对自己理论的重新表

达,爱因斯坦将其看做“掉书袋”[12],并且抱怨说:“自从数学家们突袭相对论以来,我都

开始理解不了我自己了。”[13] 他甚至对劳厄的书也表达了相同的感受,说自己对它“难以

理解”[14]。

78

Page 82: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

但当爱因斯坦越来越多地投入到广义相对论的研究中时,他被迫越来越体会到闵可夫

斯基的方法的内在优越性。事实上,闵可夫斯基时空中的无穷小不变线元3:

ds2 = dx2 + dy2 + dz2 − (cdt)2

对于表达广义相对论中弯曲的时空以及建立时空结构和引力势之间的联系是十分重要的。

大约在1912年,爱因斯坦就充分认识到了这点。

在他于1912年10月写给索末菲的信中,我们已经可以察觉到爱因斯坦观念发生转变的

苗头。他写道:

“我现在正在专心地致力于研究引力方面的问题……可以确定的是,我以前从未在研

究一个近在咫尺的理论时如此艰难过;同时,我开始对数学充满敬意,直到此前不久我还

曾幼稚地将其较为精巧的部分看作纯粹的奢侈品。和我现在在研究的问题比起来,以前的

相对论简直就是小孩的游戏。”[15]

然而,彻底的转变仍是多年之后的事。这个转变过程中十分重要的一环,便是爱因斯

坦与希尔伯特之间就广义相对论方程的形式化表述问题所进行的交流。

5 希尔伯特和广义相对论

1912年12月初,德国物理学家古斯塔夫·米(Gustav Mie)发表了一系列论文,在这

些文章中,他利用数学对自己在物质结构方面的理论进行了详细的描述。没有多少物理学

家认为他的理论有多大的重要性,特别地,他对于引力现象的解释还遭到了爱因斯坦及其

他一些人的猛烈批评。然而,希尔伯特通过同事马克斯·波恩(Max Born)了解到了这个

理论,并对之产生了浓厚的兴趣。后来,他甚至把这个理论当做建立整个物理学的大统一

理论的基础。 [16]

1915年夏天,在他对广义相对论场方程几年如一日潜心研究的高峰时期4,爱因斯坦

应希尔伯特之邀到哥廷根进行演讲,介绍他当时的研究状况。同年的10月及11月见证了爱

因斯坦科学生涯中的一个巅峰时期,使得他终于在11月25日发表了正确的方程[17]。同一

时期,希尔伯特正专注于通过将爱因斯坦的理论结合到米氏理论中,用公式建立起他自己

的物理学基础理论。在10月及11月当中,希尔伯特和爱因斯坦频繁通信往来,随时将自己

的最新研究进展通知给对方。11月20日,希尔伯特向哥廷根科学会阐述了自己的理论。直

到近期,人们还普遍认为希尔伯特展示出正确的广义相对论场方程的时间,要比爱因斯坦

早5天。然而最新的历史研究表明事实并非如此[18]。无论如何,由于这些事件的发生,爱

3这是一种古典的说法,在现代数学语言中,可理解为定义在每个切空间上的一个二次型。——译者注4原文的peek,疑为peak之误。——译者注

79

Page 83: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

因斯坦与希尔伯特之间的关系在短时间内变得有些紧张。但很快他们就恢复到了正常状

态,即,无论在私人方面还是在科学方面都对彼此怀有高度的敬意。

但在这个插曲中,除了那些有争议的个人问题,还包含我们这里所关注的更基本的问

题的一些重要方面。就其本质而言,相对于狭义相对论,爱因斯坦对于广义相对论的研究

运用了更加“数学化”而不太具有物理直观性的方法。尽管如此,希尔伯特对同一个问题的

研究方法,作为哥廷根精神以及他自己的物理观的典型体现,仍然让爱因斯坦难以接受。

希尔伯特对于物理学基础方程(包括引力场方程)的推导是建立在两个公理之上的。其一

是一个基于如下积分的变分理论: ∫H

√gdω

这里H代表米氏理论中出现的一个哈密顿函数。另一个公理是广义协变性的条件,这是希

尔伯特从爱因斯坦的理论中获得的[19]。

与闵可夫斯基早期的工作十分类似,希尔伯特的推导强调了不依赖于实验而单独由

数学原理推导出物理理论的核心方程的可能性(在希尔伯特的例子中,这个理论的确是整

个物理学的基础核心方程)。爱因斯坦对这种方法的消极反应在他于1916年11月写给赫尔

曼·外尔(Hermann Weyl,希尔伯特的得意门生)的信中被明确地表达了出来:

“在我看来,希尔伯特关于物质的假设是幼稚的,就像一个不谙世事的婴儿一样……

在任何情况下,人们都不会接受这样一个奇怪的混合体,既包含了有根据的广义相对性原

理假设,又包含了毫无根据的对于电子结构的主观臆测……发现一些关于电子结构的合理

假定,即哈密顿函数,是当前理论的最重要的任务之一。我的确是第一个承认这一点的

人。然而,那种“公理化”的方法,在其中派不上多大的用场。”[20]

爱因斯坦并不反对在物理学中使用变分法,他不能接受的是希尔伯特居然企图用这些

方法导出如此深刻的结论。事实上,在爱因斯坦于1916年6月向柏林研究院递交的论文中,

他自己也用利用哈密顿原理推导出了场方程。

希尔伯特的工作还导致了一件趣事,就是发生在1918年的关于广义相对论中能量守

恒定律的地位的一场辩论。爱因斯坦、克莱因和埃米·诺特(Emmy Noether)[21]均参与

其中。争论点在于如何将那些具有实际物理意义的不变方程与只有形式上的数学含义的

方程区分开。哥廷根学派最杰出的代表之一,埃米·诺特,就此问题发表了一些重要的文章[22]。爱因斯坦明确地称赞了诺特的工作的重大意义,并将其看做一个卓越的典范,体

现出利用数学推理可以导出一个物理理论的核心基础。我们可以猜想,这些人给爱因斯坦

造成了额外的刺激,使其越来越愿意承认数学作为科学创造力源泉的重要角色。

6 结语

在1946年写的一份自传性的文章中,爱因斯坦回顾性地分析了他在对广义相对论的探

80

Page 84: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

索中学到的重要一课:

“一个理论可以用经验来检验,但是并没有从经验建立理论的道路。像引力场方程这

样复杂的方程,只有通过发现逻辑上的简单的数学条件才能找到,这种数学条件完全地或

者几乎完全地决定着这些方程。但是,人们一旦有了那些足够强有力的形式条件,那么,

为了创立理论,就只需要少量关于事实的知识;在引力场方程的情况中,这就是四维性和

表示空间结构的对称张量,这些连同对于连续变换群的不变性,实际上几乎完全决定了这

些方程。”[23]

没有其他的阐述,可以比爱因斯坦的这段话,更好地概括出哥廷根精神在对待数学与

物理之关系问题上的具体体现。此时的爱因斯坦甚至乐于明确地提到闵可夫斯基对于他的

理论的贡献,以及希尔伯特在对场方程的推导中的那些必要的出发点。年轻的爱因斯坦肯

定会以最断然的方式反对这些观念!

(刘琳媛5 译)

参考文献

[1] Norton, J.D. in The Creation of Ideas in Physics (Leplin, J.), p. 59-64, Kluwer Aca-

demic Publishers.

[2] Einstein, A. (1954) Ideas and Opinions, p. 274, Bonanza Books.

[3] Pais, A. (1982) ‘Subtle is the Lord. . . ’ The Science and the Life of Albert Einstein,

p. 325, Clarendon Press.

[4] Norton, J.D. (1984) Hist. Stu. Phys. Sci. 14, 251-316

[5] Renn, J., and Sauer, T. (1996) Phys. Bl. 52, 865-872.

[6] Corry, L. (1997) Arch. Hist. Ex. Sci. 51, 83-198.

[7] Pyenson, L. (1979) Arch. Hist. Ex. Sci. 21, 55-89.

[8] Corry, L. (1997) Arch. Hist. Ex. Sci. 51, 273-314.

[9] Pyenson, L. (1979) Arch. Hist. Ex. Sci. 21, 55-89.

[10] Sommerfeld, A. (1910) Ann. Phys. 32, 749-776; 33, 649-689.

5基科93

81

Page 85: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

[11] von Laue, M. (1911) Das Relativitatsprinzip, Vieweg.

[12] Pais, A. (1982) ‘Subtle is the Lord. . . ’ The Science and the Life of Albert Einstein,

p. 151, Clarendon Press.

[13] Seelig, C. (1954) Albert Einstein, p. 46, Europa Verlag.

[14] McCormmach, R. (1976) Hist. Stu. Phys. Sci. 7, xxvii.

[15] Hermman, A. (1968) Albert Einstein - Arnold Sommerfeld. Briefwechsel, p. 26,

Schwabe.

[16] Corry, L. (1998) in Alternatives to Einstein’s General Theory of Relativity (Renn, J.,

ed.), Birkhauser Verlag.

[17] Einstein, A. (1915) in The Collected Papers of Albert Einstein, Vol. 6(Kox, A.J.,

Klein, M.J. and Schulmann, R., eds.), pp. 245-249, Princeton University Press.

[18] Corry, L., Renn, J., and Stachel, J. (1997) Science 278, 1270-1273.

[19] Hilbert, D. (1916) Gott. Nach. - Math. Phys. Kl. 395-407.

[20] Seelig, C. (1954) Albert Einstein, p. 200, Europa Verlag.

[21] Rowe, D.E. (1998) in The Visual World: Geometry and Physics (1900-1930), (Gray,

J.J., ed.) Oxford University Press

[22] Noether, E. (1918) Gott. Nach - Math. Phys. Kl. 37-44, 235-257.

[23] Einstein, A. (1979) Autobiographical Notes: A Centennial Edition, p. 85, Open Court.

附录

A. 本文原作者简介

Leo Corry 里奥·科里,理科硕士,哲学博士(PhD)

在特拉维夫大学教授科学史。曾在耶路撒冷的希伯来大学、柏林的马克斯-普朗克研

究所科学史分所以及麻省理工学员的迪布纳研究所科学史分所当过客座研究员。他的主

要研究方向是现代数学及物理史。他写的书Modern Algebra and the Rise of Mathematical

Structures已在Birkhauser出版社出版。

82

Page 86: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

原论文(英文)链接:

http://www.tau.ac.il/~corry/publications/articles/pdf/endeavour.pdf

B. 看过这篇论文后译者的一些想法

在当今的社会中,仍有许多人认为纯数学没有实际应用价值。这其中包括我的一些亲

戚和朋友,他们对我选择这个专业表示难以理解。毫无疑问,正如本文结语部分所引述的

爱因斯坦的话所说,纯数学的力量是巨大的。那么为什么许多人(甚至包括早年的爱因斯

坦)都看不到纯数学的重要性呢?我认为,这是因为纯数学的发展往往超前于物理学及其

他应用科学和工程学的发展。例如本文中所提到的非欧几何,是在19世纪由黎曼、罗巴切

夫斯基以及高斯等人提出并发展起来的。在其产生初期,却被学术界认为是荒谬的。高斯

甚至由于害怕遭到学术界以及教会的反对而不敢公开自己的研究成果。然而,非欧几何以

及由之发展而来的张量分析理论在二十世纪却成了广义相对论的核心基础。类似的例子还

有很多:十九世纪六十年代创立的矩阵理论在六十年后应用于量子力学,伽罗瓦在1831年

创立的群论一百余年后才获得物理应用,而阿波罗尼乌斯的圆锥曲线理论,一直到一千八

百年后才被开普勒应用于行星轨道理论。数学发展的超前,使得这些理论往往在被创立之

后的很多年才能获得实际应用,在这些年中便会被当做“无用”的理论。然而如果因为“无

用”就不去进行纯数学的研究,那么后果就是:开普勒面对第谷留下的海量数据束手无策,

海森堡想破脑袋也想不出不确定性关系,爱因斯坦永远也无法推导出广义相对论的正确的

方程。那么科学如何发展,人类又怎样进步?所以,我们应当对纯数学的力量怀有一种坚

定的信仰,坚信它具有永恒的难以比拟的价值,并执着地对它进行研究。这样,科学发展

才能源源不断地获得动力。

除此之外,从本文中我还看到,爱因斯坦的理论并不是以他一人之力发展来的,而是

在与其他科学家的相互交流与启发之中共同发展来的。在对数学史的学习中,我也经常看

到,许多数学家的重要理论,都或多或少地受到了同时代的其他数学家的启发,有些甚至

最初就是记录在与其他人的通信之中的(比如著名的哥德巴赫猜想)。所以我认为,要想

更好地进行数学以及其他科学的研究,我们不应当把自己封闭在自己一个人的狭小空间

中,将其他人都视为敌人。而应当多与他人交流自己的想法,同时倾听他人的想法,相互

启发,共同取得更加深刻的研究成果。

83

Page 87: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t

征稿启事

《荷思》是清华大学数学系学生自主创办的数学学术刊物,面向各个院系中对数学感

兴趣的本科生及研究生。

本刊欢迎全校师生任何与数学有关的投稿,无论是长篇的论述,还是精彩的小品,抑

或学习/教学的心得、习题的妙解。在原作者的允许下,推荐他人的作品也同样欢迎。

为了编辑方便,建议投稿者能够提供电子版,并且采用 LATEX或Word排版。来稿请

注明作者,联系方式。

投稿请寄:[email protected]

欢迎访问荷思网站:http://mathmu.cn/hesi

《荷思》编辑部

2011-5

主办:清华大学数学科学系《荷思》编辑部

主编:苏桃

顾问:杜升华

编委:(按姓氏笔画为序)

毛天一 乐鹏宇 冯 鑫 朱艺航 刘诗南 刘琳媛

苏 桃 杜升华 李奇芮 李梦龙 杨 鑫 余成龙

张 铭 张端阳 费 腾 谢松晏 潘锦钊

封面:陈凌骅

排版:潘锦钊

联系本刊:[email protected]

北京市海淀区清华大学紫荆9号楼 101A

010-515-31823

84

Page 88: , )math.mit.edu/~aosun/hesi07.pdf · H. Lebesgue *ó 4ê5Ù Ý 1901 4 e 29 ¥³ ô 0¥ HenriLebesgue }w8 3³ 0 ] ¹qx (Comptes Rendus de l'Academie des Sciences de Paris) h ¶ t