所以我们发现,我们希望定义域本身能够对集合的运算之间具有某种封闭性。“封闭性”这种要求,学过抽象代数的同学应该深有体会。比如我们发现有理数对开方运算不封闭,所以我们需要在实数上研究分析学。由此可见,我们有充分的理由对定义域加上好的条件(下面就会提到,我们需要施加一系列
封闭性
,最后我们定义出了 \(\sigma\) 代数这一很好的集合系作为定义域),使得我们能够舒服地将其作为测度的定义域。
此外,测度这个函数本身也应当有好的性质。假设我们的 \(\Phi\) 已经足够好,能够保证 \(A \cup B \in \Phi\) 了,但我们还是不能写出 \( \mu(A \cup B) = \mu(A) + \mu(B) \) 这样的计算式。这使我们意识到,测度也应当与集合的运算具有某种关系(下面就会提到,我们需要可加性、有限可加性等等)。有的人提过如果元素是构成一个体系的基本,那么运算就是描述了这个体系的结构——这就是为什么同构如此重要而优美,因为它保运算。因此我们也希望对测度加一些类似于
保运算
的限制,使得我们能够做一些直觉的运算。(什么叫“直觉”的运算?比如我们似乎应该要保证,两个不交的集合的测度是能加起来的)
但数学家们追求完美,他们既想要加条件使得其完美,又不想加太多条件使得其太过特殊(不然的话,我们直接研究很简单的面积就好了),从而使其能够抽象地用于各种场景。因此,他们希望能加最少的限制建立起测度论。这就是为什么这件事很困难。
测度的基本性质
在考虑定义域前,我们先给出一些我们希望的,测度具有的性质。之后,就可以对照着这些性质,给出我们每次加强集合系的理由了。
当然,这部分有点长,也可以先跳过这一章看下面,等到提及时再来看有关的部分。
有限可加性
\(A_1, A_2, \dots, A_n \) 是集合系中两两不交的集合,则
$$
\mu(\bigcup_i A_i) = \sum_i \mu(A_i)
$$
如果我们约定当集合不交的时候,集合的并集可以用“加号”表示,上述式子还可以写成一个更好看的样子
$$
\mu(\sum_i A_i) = \sum_i \mu(A_i)
$$
这应该是很多人想到测度最基本的一个性质——整体等于部分之和。
\(A, B\) 是集合系 \(\Phi\) 中两个集合且 \(A \subset B\),如果 \(B-A \in \Phi\) 且 \(\mu(A) < +\infty\),那么有
$$
\mu(B-A) = \mu(B) - \mu(A)
$$
有了可加性,我们自然希望也要有个可减性。定义倒没什么特别的,但是这里注意要有的 \(\mu(A) < +\infty\) 的限制:这是因为 \(\infty - \infty\) 没有意义。就和我们小时候除数为 0 一样,因为 \(\infty\) 加任何数都为无穷,所以逆运算可以是任何数。
\(A, B\) 是集合系 \(\Phi\) 中两个集合且 \(A \subset B\),则
$$
\mu(A) \le \mu(B)
$$
这一性质就保证了可减性不会出现负数的情况。“单调性”的本质就是维持一个函数,定义域和值域的序结构一致。而部分大小小等于整体大小,也是一个直觉上我们希望测度拥有的性质。
下面的性质则是涉及测度连续性的部分,可能不是那么直观,但这能让我们对无穷的情况进行分析
(上/下)连续性
先给出一列集合递增的定义。我们知道集合的序结构就是 \(\subset\),所以很自然有
如果一列集合列 \(\{A_i\}\) 满足 \(\forall i, A_i \subset A_{i+1}\),我们称它递增。
如果一列集合列 \(\{A_i\}\) 满足 \(\forall i, A_i \supset A_{i+1}\),我们称它递减。
研究连续性当然要先定义极限的概念。但集合列中收敛的概念我们这里暂不给出,不过对于单调(即递增或递减)的集合列,读者应该能感觉出单调的集合列会收敛什么样的集合。以递增集合列为例,
$$
\lim_{n \rightarrow \infty} A_n = \bigcup_i A_i
$$
接下来,我们给出测度在递增集合列的下连续性
设一列递增集合列 \(\{A_i\}\) 收敛到 \(A\),那么
$$
\lim_{n \rightarrow \infty} \mu(A_n) = \mu(A)
$$
上连续性也是同理,不过和可减性一样,要保证集合列的第一个集合测度不能是无穷,即这一递减集合列要满足 \(\mu(A_1) < +\infty\)。
实际上,这一堆性质其实都能被一个性质等价,那就是
可数可加性
(当然!仅限 \(\sigma\) 代数上。所以我们下面说明一个定义域不强,实际上就是想说明具有可数可加性的测度不能涵盖上面的性质。以及后面我们也会做到,能够把一个弱一点的结构上的测度延拓到强的结构上,这就是测度延拓定理)。所以大部分地方定义测度,都直接把可数可加性作为测度的定义。
可数可加性
\(\{A_1, A_2, \dots, \}\) 是集合系中两两不交的集合列,则
$$
\mu(\bigcup_i A_i) = \sum_i \mu(A_i)
$$
有限和可数之间差了一个无限的过程,这一过程就相当于一个取极限的过程。我们概率论老师就经常强调,“任意有限”和“可数”是不一样的,你用数学归纳法并不能证明可数的情况。所以可数可加性要比有限可加性强很多。
这里还需要提到一个次可加性的概念,这一概念会在定义
外测度
的时候使用。外测度其实是数学家们不能定义出测度而作出的一个“上界”的妥协,就像上极限一样。当有时候做不到可数可加时,如果能有一个不等式成立,也是不错的:
\(\{A_1, A_2, \dots, \}\) 是集合系中的集合列,且 \(A \subset \bigcup_i A_i\),则
$$
\mu(A) \le \sum_i \mu(A_i)
$$
也就是它不需要不交的集合拼起来精确相等,只需要集合列并起来的大小相对于大小加起来更小即可。注意,可加性不一定包含次可加性!因此,测度也不一定是外测度,只有在 \(\sigma\) 代数上才有可加性包含次可加性。
同时注意它的定义,是“对于任意的、属于无穷并的集合”,有这个小等于关系。区别在于无穷并是否属于集合系;如果不属于,那次可加性只要求这个集合系中式无穷并子集的集合满足该不等式。
依照测度的加强,我们可以将不同的测度按照强度排序:
-
有限可加测度
-
测度(\(\sigma\) 可加测度,可数可加测度)
所以我们给出测度的定义如下:
设集合系 \(\Phi\),函数 \(\mu: \Phi \mapsto [0, +\infty]\) 满足可数可加性,且至少有一个 \(A \in \Phi\) 使得 \(\mu(A) < + \infty\),则称该函数为测度
其中,那个很奇怪的“存在有限”的限制,如果放到代数上研究,可以用“空集大小为0”代替。但很遗憾,如果我们想研究一些不包含空集的集合,我们就需要变一变说法。事实上,研究一个全是无穷的测度并没有什么意义——因为做加法运算永远都是无穷,而你又不能做什么减法运算。
\(\sigma\) 这个符号后面也会出现我们的 \(\sigma\) 代数中。实际上,这个符号其实就是想表达“从有限到可数无限”这一过程。
所以,只需要牢牢记住:测度最根本的性质是可数可加性,带着这个往下看就行了。
接下来我们考虑不断加强我们的定义域。
路线1 - 从 \(\pi\) 系开始
这条路线的总览是这样的:
-
\( \pi \) 系
-
半环 / 半集代数
-
环 / 集代数
-
\(\sigma\) - 环 / \(\sigma\) - 代数
注意区别,这里的环和群环域的环不是一回事(但也许有某种关联?我也不知道)。
\(\pi\) 系
不要被这个名称吓到了。为什么叫 \(\pi\) 系呢?我也不是很清楚,只要记住它是一个非常非常简单的集合系就好了,注意和后面的 \(\lambda\) 系区分清楚。
我们首先考虑集合的两个基本运算:交和并。实际上这也基本概括了集合的所有运算,因为差、对称差(异或)都可以用它们表达。我们考虑先对哪个封闭。为什么不直接一起封闭呢?因为太强了QAQ(一起封闭,这个结构就可以被称作环了),我们希望一点点加强,这样才能保证我们的条件是最少的。
数学家选择,首先先对交集封闭,也就是 \(\pi\) 系的概念:
\(\pi \) 系是一个集合系 \(\Pi\) ,满足:
1. 如果 \(A \in \Pi, B \in \Pi\),那么 \(A \cap B \in \Pi\)
为什么首先对交集封闭比较好呢?我们试从“生成”的角度来看。假如你现在有集合 \(A, B\),如果你对它们做并集操作,这会是一个更大的集合;而交集则是一个更小的集合,并且都是 \(A, B\) 的子集。我们一般会希望先处理好子集的所有性质,这样如果我们能给定一个全集,就能很好地封闭。而且我们后面会看到,“交”的概念能给我们很快构造出一个“最小符合某一性质”集合的方法,只要把所有符合某一性质的集合交起来就可以了。不管怎么说,我们都更喜欢交。
定义里虽然只出现了两个集合的交,但很容易能看出其等价于有限集合交集的封闭性。
但是,我们发现这样的集合系不一定有空集。我们希望研究的任何集合系中都包含空集 \(\emptyset\),而且我们后面会规定空集的测度为 0。这很自然,并且为某个“无限性质”包含有限的情况提供了很大的方便。(试想,你对无限成立,那我取除了某两个集合以外的集合都为空集,是不是就对两个集合的情况成立了)
没有空集是件很残酷的事。那我们能直接把空集加到 \(\pi\) 系中,然后继续进行吗?某些情况是可以的,但这一加强不够本质。我们来看如下例子:
比如我们来考虑如下 \(\pi\) 系:
$$
\{\emptyset, A_1, A_2, \dots, A_n, A\}
$$
其中 \(A_i = \{i\}\),\(A=\{1, 2, \dots, n, n+1\}\)。也就是包含了所有散点和一个最大的集合的集合系。
容易验证它是 \(\pi\) 系,因为任意的 \(A_i, A_j, i \neq j\) 交集都是空,\(A\) 和其它集合的交集就是那个“其它集合”。那我们来很自然加上一个测度:
$$
\mu(\emptyset) = 0 \\
\mu(A_i) = 1 \\
\mu(A) = n+1
$$
我们发现我格外构造的那个 \(n+1\) 非常奇怪,它使得我们没法简单地把 \(A_i\) 加起来来获得 \(A\),\(\{n+1\}\) 甚至都不存在。
这就是 \(\pi\) 系的可悲之处了——一个集合在其中,甚至不一定能找到自己所有的组成要件。
很容易想到,这是 \(pi\) 系对差集不封闭导致的:我们知道了全集,以及它的一部分,但剩下部分不一定在集合里。
我们可以考虑直接加上差集的条件,但是我们也可以退而求其次(这就是“半”的意思),不要求剩下部分一定要在集合里,只要剩下部分能被我集合里的东西组合出来就可以——这样就可以满足,如果 \(A \in \Pi\),那么我们一定能找到一些集合组合出它。(可能你会想,\(A\) 自己不就能组合成自己?当然这里得意会一下,对于最小的集合就不要纠结这些啦~)
以本例,如果你要求剩下的部分能组合出 \(\{1, 2, \dots, n+1\}\),那么 \(\{n+1\}\) 包含进去,就能满足条件。
这里再给一个例子说明“不能找到组成条件”违反了什么严重的性质,以此来说明 \(\pi\) 系的可悲。
$$
\{\emptyset, B, B_1, B_2, \dots\}
$$
其中 \(B_i = \{1, 2, \dots, i\}\),\(B=\{1, 2, \dots\}\)。
然后我们定义测度:
$$
\mu(\emptyset) = 0 \\
\mu(B_i) = i \\
\mu(B) = 114514
$$
你可能觉得最后一行我是乱定义的,但是请想想:它违反了什么定义吗?
我们说,测度本质特征就是可数可加性。这个集合系中,除了空集以外的集合都有交集,因此你没办法找到一些不交的集合来组成 \(B\) 这个集合。但是 \(B\) 却是递增集合列 \(\{B_i\}\) 的极限,理应是 \(+\infty\),我们却可以定义它为任何值——因为它无法被加出来。
因此,我们能够定义一个相对合理的测度,起码你要“能被类中的某些集合加出来”。下面介绍的半环、半代数,就引入了我们前面呼之欲出的那个性质。
由于上面已经做了足够的引入,我们这里直接给出半环的定义:
如果一个集合类 \(C\) 满足:
1. 若 \(A, B \in C\),则有 \(A \cap B \in C\)。
2. 对于 \(A_1, A \in C\) 且 \(A_1 \subset A\),则存在两两不交且与 \(A_1\) 也不交的集合 \(\{A_2, A_3, \dots, A_n\} \subset C\) 满足
$$
\sum_{i=1}^n A_i = A
$$
注意这里关于半环的定义没有 \(\emptyset \in C\),这是因为,如果我们约定第二条性质中存在的那些集合 \{A_2, \dots, A_n\} 至少有一个,那么我们考虑此集合系中任意一个集合 \(A\),对自身用第二条性质(即因为 \(A \subset A\),存在至少一个集合与 \(A\) 相加等于 \(A\)),那么自然有空集包含在内。不过当然,有的地方为了严谨,也会加一条:空集属于其中。
我们简单带过细节,重点关注半环的本质特征,也就是新引入的 2。2 说明,假设你是一个复杂集合 \(A\),也即你至少有一个真子集在 \(C\) 中,那么你一定能在 \(C\) 中找齐一些集合,把它们加起来就得到你。
也就是说,一个半环中的集合永远能被有限可加得到。注意这和有限可加封闭还不大一样。
当然,这一性质也比“差”封闭要弱,这是因为你找的那些 \(A_2, dots, A_n\) 属于这个集合系,但是 \(\sum_{i=2}^n A_i\) 却不一定属于,这是关于半环特别要注意的。
这里给出一个半环的实例:
例:\(\mathbb{R}\) 上的所有左开右闭区间(包括空集)构成半环。
我们来逐一验证。首先空集属于它。然后,任取两个左开右闭区间,它们的交一定还是左开右闭区间。
最后,对于任意的 \(A=(a, b], A_1 = (a_1, b_1]\) 满足 \(A_1 \subset A\),我们能找到 \(A_2 = (a, a_1], A_3 = (b_1, b]\)(如果区间的右边界小于左,视作空)满足两两不交的 \(A_1 + A_2 + A_3 = A\)。
别看半环似乎还是比较弱,但实际上半环就是最简单的能够在上面定义良好测度的结构,也就是我们的用可数可加性定义的测度在半环上满足以上提到的所有良好性质。也正是因此,半环(或者半代数)成为测度扩张定理的基础,我们正是从半代数上的测度扩张到 \(\sigma\) 代数。
“环”与“代数”
在这里,可能你会注意到我一直将“环”与“代数”一直用“或”来连接。这是因为到目前为止,我们关心的性质上,这两个结构还没有区别。接下来,我们介绍代数和环的区别,之后我们便不在环上讨论,都讨论代数了。
对于一个非空集合(一般称作全集)\(\Omega\),我们考虑它的子集类,即它所有子集构成的集合系。如果这个子集类 \(C\) 是一个半环,且
$$
\Omega \in C
$$
我们称 \(C\) 为一个半代数。
可以看出,半代数实际上就是半环多了一个“全集”的概念。事实上,所有的环,半环、环、\(\sigma\) 环,加上一个全集的概念之后就变成对应的代数。
因为 \(\Omega\) 是全集,所以我们从研究任意一个集合系变成了研究它的子集类,也就是说我们研究的任何一个集合都必须是它的子集。这对于我们研究概率论大有好处——因为概率论一般都要有一个“必然事件”,也就是概率测度等于 1 的那个事件。
是环还是代数,对我们研究集合系的封闭性方面倒没有太大影响。因此基本上环和代数在我们讨论的范畴可以认为差不多。
集代数,又叫代数(当然,半代数又叫半集代数),也叫布尔代数(这可能是因为它包含了基本的逻辑概念),是半代数的加强。比起半代数,可能集代数的定义更自然、更不拗口。我们不加解释地直接给出集代数的定义:
全集 \(\Omega\) 的子集类 \(C\) 称作集代数,如果:
1. \(\Omega \in C\)
2. 如果 \(A, B \in C\),那么 \(A \cup B \in C\),\(A \cap B \in C\)。
3. 如果\(A \in C\),那么 \(A^c = \Omega \setminus A \in C \)。
之所以说自然,可以联想一下“群”:对某种运算封闭,并且可逆。集合的补集某种意义上也算是一个逆。对一个代数,我们要求对交、并、补封闭,实际上就几乎囊括了所有集合的操作。实际上,它们和我们想要的 \(\sigma\) 代数仅有一步之遥:代数只局限于有限的情况,而 \(\sigma\) 代数在无限的情况也封闭。
当然,其实第二条也不用交和并都封闭,则一即可。这是因为,如果对并封闭,那么 de Morgan 律也会保证交封闭。反之亦然。
$$
A \cup B = (A^c \cap B^c)^c \in C
$$
关于集代数,我不想介绍太多,因为它仅仅只是个比较优美的结构。在我们的探讨里,集代数基本就相当于一个桥梁,连接半代数和 \(\sigma\) 代数。
在后面扩张时,我们一般会选择先将一个半代数扩张到集代数,再扩张到 \(\sigma\) 代数。因此,这里有必要先介绍一下扩张的基本方法:“生成”的概念。
定义一个半集代数 \(C\) 生成的集代数
$$
\mathbb{A}(C) = \bigcup_{C' \supset C 且 C' 为集代数} C'
$$
这就是一个集合S“生成X”的一般方法:把所有包含S的符合X的交起来。“生成”最本质的含义是最小,即生成集代数就是包含该半集代数的最小集代数,比它小的,包含这个半集代数的,都不是集代数。
“一直交”是数学中构造最小、最紧的通用方法之一。一定要有深刻印象。
当然,这个定义还需要证明一个引理,也是所有使用“一直交”的地方都需要注意的:你怎么知道两个集代数交起来还是集代数?这是容易证明的,这里就略过。(可以直接按定义验证)
我们来证明一个关于生成集代数的引理来结束集代数这一部分:
引理:设 \(C\) 是半集代数,则
$$
\mathbb{A}(C) = \{\bigcup_{i=1}^n A_i \mid A_i \in C\}
$$
这个引理的意思是,\(C\) 生成的集代数等于 \(C\) 中任意有限个集合取并,所得到的所有集合组成的集合系。
我们记 \(D = \{\bigcup_{i=1}^n A_i \mid A_i \in C\}\),只要证 \(D = \mathbb{A}(C)\)。首先我们来证明它是个包含 \(C\) 集代数。包含 \(C\) 是显然的,下面证它是个集代数。
而: \(\Omega \in C\) 所以 \(\Omega \in D\)。
对于任意 \(A, B \in D\),\(A \cup B \in D\),这是因为它也是 \(C\) 中有限个集合的并。设 \(A = \bigcup_{i=1}^n A_i, B = \bigcup_{i=1}^m, A_i, B_i \in C\),那么
$$
A \cap B = (\sum_{i=1}^n A_i) \cap (\sum_{i=1}^m B_i) = \sum_{i=1}^n \sum_{j=1}^m (A_i \cap B_j) \in D
$$
对于任意 \(A \in D\),假设 \(A = \bigcup_{i=1}^n A_i, A_i \in C\)。则由 de-Morgan,
$$
A^c = \bigcap A_i^c
$$
因为 \(C\) 是个半集代数,所以对于 \(A_i \subset \Omega\),存在两两不交的集合列 \{B_{i1}, B_{i2}, \dots, B_{im}\}\) 使得 \(A_i^c = \sum_{j=1}^m B_{ij} \in D\)。因此它是个集代数。
而它是最小集代数几乎是显然的。因为集代数默认要求有限个交封闭。因此证明完毕。