第一次就能看懂的勒贝格(Lebesgue)积分(一)
如需转载,请务必注明出处,并附加本文链接。
前言
这份讲义的目标是:让没有学过黎曼积分的人学懂勒贝格积分。当然,我也希望这份讲义也可以给已经学过积分的同学带来一些新的思路。
讲义比较长,所以会分几次发布。如果想看后面的内容,可以“+关注”我并等待更新。新文章的链接会放在下面的目录里。
讲义的第二部分已经发布: 第一次就能看懂的勒贝格(Lebesgue)积分(二):芝诺悖论
如果大家有疑问,可以写在评论里。
数学中,很多概念的定义都来源于我们对一些东西的直觉。其中一个例子是积分。我们知道长方形的面积是多少,并且对面积的概念有以下直观上的认识:
- 如果把两块图形无重叠地拼在一起,则总面积等于每部分的面积相加;
- 如果一个图形包含另一个图形,那么被包含的那个图形面积更小。
这些关于大小的认知几乎是与生俱来的,是原始人也大概率知道的, 虽然简单,但非常重要 。
用这些直觉,可以推断出很多不同的图形面积“应该”是多少:我们在小学课本里就见过这种推导。但是,这些规律含义并不确切。当我们尝试严格定义“面积”的概念,创造一个“积分”的理论时,会发现符合以上直觉的定义不止一种,而这些定义又不相互等价。因此,我们有很多不同的定义方式,很多不同的积分理论:现代分析学中最常用的是勒贝格(Lebesgue)积分,但是还有黎曼(Riemann)积分等其他 好几种 理论。每一种积分理论也可以用很多不同的,但是等价的方式建立。比如,达布(Darboux)积分就和黎曼积分等价。
我们第一次学积分的时候,通常学的是黎曼积分,但是勒贝格积分相比黎曼积分有以下优点(当然,以下这几点不是绝对的,不同的人可能有不同的看法):
- 更加简洁。勒贝格积分的技术性细节要比黎曼积分少很多。黎曼积分理论中的证明经常会出现一大堆的 \epsilon/2 和 \epsilon/4. 勒贝格积分的证明中较少出现这样的细节(当然还是有的)。
- 更加直观。勒贝格积分有多种等价的定义,但 如果使用比较简洁的定义 ,则定义中几乎每一步都符合我们对面积的直觉,非常自然。黎曼积分总体上也非常符合直觉,但是很多细节都较难理解,难以留下深刻的印象。总体上来讲勒贝格积分更接近面积的本质。
- 更加“强大”。黎曼可积的函数一定勒贝格可积,而黎曼不可积的函数也有可能勒贝格可积(这里不包括反常积分)。
- 更容易处理二重积分、曲面积分等等。
- 勒贝格积分有更好的性质,在调和分析、偏微分方程、泛函分析中有广泛的应用。
- 勒贝格积分可以很容易地推广到其它抽象的数学结构上。
但是,勒贝格积分也更加抽象,会给学习造成一定的困难。讲勒贝格积分的书/课程通常会要求较高的基础知识,使没有学过积分的人望而却步。 我们知道,勒贝格积分是“实变函数”这门课程的核心;经常有人说,这门课学了可数多遍还是几乎处处不懂。尽管如此,如果以合理的方式把每一步解释清楚,则会发现勒贝格积分的定义和构造其实非常自然,比黎曼积分更加简洁:这就是下面我们尝试做的事情。
当然,在有一些地方,黎曼积分的概念还是非常有用的,所以最后也会用 与勒贝格积分相似的方法介绍,以说明它们的联系 。
下面我会用尽量少的基础知识,从面积的直观几何意义出发,把积分的概念讲清楚。
关于参考: 大部分实分析的书都会涉及下面的很多内容,包括Walter Rudin的Real and Complex Analysis,以及Elias M. Stein, Rami Shakarchi的Real analysis: measure theory, integration, and Hilbert spaces. 当然这些书的内容会比这份讲义难一些。
目录
- 前言
- 集合/函数/极限
- 最简单的积分
- 长度(一)
- 芝诺悖论( 第一次就能看懂的勒贝格(Lebesgue)积分(二):芝诺悖论 )
- 长度(二)(等待更新)
- 勒贝格下积分(等待更新)
- 可测函数和积分(等待更新)
- 积分的简单性质(等待更新)
- 黎曼积分(等待更新)
- 结语(等待更新)
续集:
勒贝格测度的定义和性质:
勒贝格测度可加性的证明:
积分的定义:
集合/函数/极限
我们先复习一些基本概念。在下面所有的地方,符号 := 表示“定义为”。比如 f(x):=x+1 的含义为“将 f(x) 定义为 x+1 ”.
集合
对于常见的一些集合,我们用以下符号表示: \mathbb R 是实数集合, \mathbb Q 是有理数集合, \mathbb N=\{1,2,\ldots\} 是正整数集合。注意在这里 \mathbb N 不包括 0. 在其他的资料中, \mathbb N (自然数)的定义可能包含 0. 不同的作者可能有不同的定义。
集合有以下几种基本运算。
定义(集合的基本运算):
设 X 为一个集合, A_j \subseteq X, j=1,2,\ldots 是一些子集。我们称 X 为 全集 ;它包含了我们关心的所有元素。
并集: 定义
\bigcup_{j=1}^\infty A_j := \{x\in X: \exists j\in\mathbb N, x\in A_j\}\\
其中 \exists j\in\mathbb N, x\in A_j 含义为“存在 j 使得 x \in A_j ”. 所有满足这个条件的 x 属于这个并集。
交集: 定义
\bigcap_{j=1}^\infty A_j :=\{x\in X: \forall j\in\mathbb N, x\in A_j\}\\
其中 \forall j 表示“对所有的 j ”.
差集: 我们定义 A\backslash B := \{x\in X: x\in A,x\notin B\}.
补集(Complement) : 我们将 E 的补集 E^c 定义为 E^c = X\backslash E.
关于集合之间的函数(映射),我们有如下定义( 非常重要 ):
定义(单射、满射、双射、像、逆像等等):
- 设是两个集合。如果有一个 X,Y 之间的对应关系 f 使得每一个 x\in X 都与 唯一 的一个 y\in Y 对应,则称 f 为一个函数或者映射,记为 f:X\to Y. 其中 X 是 f 的 定义域 , Y 是 f 的 上域(codomain) 。
- 如果 A\subseteq X, B\subseteq Y, 则我们定义 A 的 像(image) 为 f(A):= \{f(x):x\in A\}, 定义 B 的 逆像(inverse image) 为 f^{-1}(B):=\{x\in X:f(x)\in B\}. 我们定义函数 f 的 像 为 f(X), 即整个定义域的像。 f(X) 是 Y 的子集,但不一定等于 Y.
- 我们说 f 是 单射 ,如果 \forall x_1,x_2\in X,f(x_1)=f(x_2) 当且仅当 x_1=x_2. 我们说 f 是 满射 ,如果对于所有的 y\in Y 我们都有 x\in X, 使得 f(x)=y. 如果 f 既是单射也是满射,则说 f 是 双射 。
- 设 f,g:\mathbb R\to \mathbb R 是两个函数。如果对于所有的 x\in\mathbb R, f(x)\leq g(x) 则我们说 f\leq g.
另外,我们有特征函数的概念。
定义: 设 E\subseteq X, 则我们定义 E 的 特征函数 \mathbf 1_E: X \to \{0,1\},
\mathbf 1_E (x)=\begin{cases} 0, x \notin E;\\ 1, x\in E. \end{cases}\\
特征函数的值告诉我们 x 是否在 E 中:输出 1 代表“是”, 0 代表“否”。
“可数”是一个常用的,描述集合大小的概念。
定义: 我们说一个集合 X 可数,如果 X 中的元素可以与全体正整数 \mathbb N 建立一一对应,即存在一个双射 f:\mathbb N \to X. 简单来说,就是 X 中的元素可以这样列出来:
x_1,x_2,x_3,\ldots\\ 这里 x_n 是 n\in \mathbb N 所对应的 X 中的元素: x_n=f(n).
比如,如果有无穷多个实数,记为 \{c_1,c_2,\ldots,c_n,\ldots\}, (每一个正整数都对应一个实数)则我们说 有可数多个实数 。
可数集合是“最小”的无穷集合。如果一个集合可数,说明它和 \mathbb N 一样“大”,而不能更大。
例: \mathbb N 是可数的; \mathbb Z 和 \mathbb N \times \mathbb N=\{(n_1,n_2):n_1,n_2\in \mathbb N\} 都是可数的。 \mathbb Q 是可数的,但 \mathbb R 不可数。
证明: 显然 \mathbb N 可以和自己建立一一对应。我们可以这样列出 \mathbb Z 的所有元素:
0,1,-1,2,-2,3,-3,4,-4,\ldots\\ 如果我们把这个序列的第 n 项与正整数 n 对应,则会得到一个双射 f:\mathbb Z \to \mathbb N, f(0)=1,f(1)=2,f(-1)=3,
f(x)= \begin{cases} 1, \text{当$x=0$时,} \\ 2x,\text{当$x>0$时,}\\ -2x+1,\text{当$x<0$时.} \end{cases}
对于 \mathbb N \times \mathbb N, 我们同样可以以如下的方式列出 所有 这个集合中的元素:
(1,1),(2,1),(1,2),(3,1),(2,2),(1,3),(4,1),(3,2),(2,3),(1,4),(5,1),\ldots\\ 如果我们把这个序列的第 n 项与正整数 n 对应,则也可以建立一一对应。具体的函数表达式这里就略去了。
\mathbb Q 的证明也类似:我们可以以同样的方式列出所有的有理数
0,1,-1,\frac21,\frac12,-\frac21,-\frac12, \frac31,\frac22,\frac13,-\frac31,-\frac22,-\frac13,\frac41,\frac32,\frac23,\frac14,\\ -\frac41,-\frac32,-\frac23,-\frac14, \ldots
但是这里有重复的数,比如 1=\frac22. 因此,我们删掉所有第二次出现的数,第三次出现的数,第四次……等等。于是我们去除了所有的重复:每个数只会出现一次。
0,1,-1,\frac21,\frac12,-\frac21,-\frac12, \frac31,\frac13,-\frac31,-\frac13,\frac41,\frac32,\frac23,\frac14,\\ -\frac41,-\frac32,-\frac23,-\frac14, \ldots
如果我们把这个序列的第 n 项与正整数 n 对应,则建立了一一对应。
可以用Cantor对角线法证明实数集合 \mathbb R 是不可数的,但是这个结论在下面并不会用到,所以这里将证明略去。 \square
实数、无穷大、和级数
为了更方便地处理无穷,我们引入扩展的实数集合 {\mathbb R} ^\ast= \mathbb R \cup \{-\infty,+\infty\}=[-\infty,+\infty]. 现在可以规定一些关于无穷的运算:如果 a\in \mathbb R, a>0, 则
+\infty+a=a+\infty=+\infty, -\infty+a=a-\infty=-\infty, \\ a\cdot (-\infty)=(-a)\cdot (+\infty)=-\infty, a\cdot (+\infty)=(-a)\cdot (-\infty)=+\infty,
而 +\infty-\infty 则没有定义。另外,无穷大和实数之间可以比较大小: -\infty <-a, a<+\infty.
最重要的一点是:我们规定 0\cdot(\pm \infty) =0. 这看起来并不总是符合我们对无穷的认识 ,但是可以让后面的理论变得简单有效。
第一次学数学分析的时候,可能会强调“不要把无穷大当成一个数来运算、比较大小”。 但是,这里我们有必要做出上面的规定 ,因为这样可以简化很多符号和陈述,帮助我们抓住很多问题的重点。
设是 (x_n)_{n\in \mathbb N} 可数多个非负实数。则我们定义所有的 x_n 和为
\sum_{n\in \mathbb N} x_n=\sum_{n=1}^\infty x_n,\\
可以证明:若级数收敛,则这个和的值与 x_n 的顺序无关。若级数发散,则不论如何排序,级数都发散。
这里我们 约定 :如果级数发散,则和为 +\infty. 因此, 不管两个非负级数是否收敛, 不等式
\sum_{n} a_n \leq \sum_n b_n\\ 都有意义。其含义是:如果 \sum a_n,\sum b_n 均收敛,则 a_n 的和小于或等于 b_n 的和, 并且 如果 \sum a_n 发散,则 \sum b_n 发散。所以当 \sum b_n 发散时,不论 a_n 为何值,这个不等式都成立。注意: 以上只对非负级数有效 。
最小上界
讨论积分时,我们会用到一个集合 A\subseteq \mathbb R 的“最大值”和“最小值”的思想;但是我们知道,集合中最大/最小的元素可能 不存在 。比如,不存在最小的正实数(没有最小、只有更小),但是正数集合的“底部”是 0. 所以,我们要使用以下概念来代替“最大值”和“最小值”:上确界、下确界总是存在的。
定义: 设 A\subseteq \mathbb R 是一个上有界的集合(即存在 M\in \mathbb R 使得 A 中的每一个数都小于或等于 M )。 如果一个实数 s 满足以下两个条件:
- 对于任意的 x\in A, x\leq s.
- 不论 \epsilon >0 有多小,总存在 x\in A, 使得 |x-s|<\epsilon. 即: A 中的数可以无限接近于 s.
则称 s 为 A 的 最小上界 ,又称为 上确界 ,记为 s=\sup A.
可以证明确实是所有上界里最小的,因为它正好在集合的“顶端”。另外,如果 A 是上无界的(即不是上有界的),则可以说 \sup A =+\infty.
用类似的方法可以定义集合的最大下界(下确界)。
定义: 设 A\subseteq \mathbb R 是一个下有界的集合。如果一个实数 s 满足以下两个条件:
- 对于任意的 x\in A,x\geq s.
- 不论 \epsilon >0 有多小,总存在 x\in A, 使得 |x-s|<\epsilon.
则称 s 为 A 的下确界,记为 s=\inf A. 如果 A 是下无界的,则可以说 \inf A =-\infty.
根据实数理论,任何一个的非空子集的上确界、下确界存在(有可能是 \pm\infty )且唯一。
最简单的积分
考虑这样的一个函数: f(x) = \sum_{j=1}^n c_j \mathbf 1_{[a_j,b_j)}=\begin{cases} c_1, x\in[a_1,b_1),\\c_2, x\in[a_2,b_2),\\ \vdots\\ c_n, x\in[a_n,b_n);\\ 0, \text{对于其他$x$的值}.\end{cases}\\
其中 a_1<b_1\leq a_2 <b_2 \leq \ldots <b_n,c_j\geq0. 人类的本能告诉我们, f(x) 的图像和 x 轴之间的面积由若干个矩形构成,而每个矩形的面积为 c_j(b_j-a_j). 所以,总面积(记为 \int f )是 \int f= \sum_{j=1}^n c_j(b_j-a_j).\\
不管以何种方式定义积分 ,这个式子都应当成立,否则积分就不符合我们对面积的直观感受了。
注意上面的面积公式有两个要素: “高度” c_j 以及“长度/宽度” b_j-a_j. 我们下面来讨论这两个概念。
长度 (一)
我们现在 尝试 定义的子集的长度。 开头提到的对面积的直觉对长度也适用。 直觉上, [0,2] 这个区间的长度为 2, 集合 (0,1)\cup (5,8) 的长度为 1+3=4. 以这种方式,我们可以得到很多不同的集合的长度。我们也可以使用无穷级数推广长度的概念。如果我们有 可数 多个 互不相交 的区间 (I_j)_{j=1}^\infty, 其中每个可能是开区间 (a_j,b_j), 闭区间 [a,b], 或者半开半闭区间 [a_j,b_j),(a_j,b_j]. 我们知道, I_j 的“长度”是 \ell(I_j)=b_j-a_j. 现在,如果 E=\bigcup_{j=1}^\infty I_j,\\ 那么我们可以定义的长度为(注意现在只是在尝试,还没有确定如何定义):
\ell(E):=\sum_{j=1}^\infty (b_j-a_j)=\sum_{j=1}^\infty\ell(I_j).\\ 如果级数发散,则长度是 +\infty.
这里顺便说一下,空集 \emptyset=(0,0)=(a,a) 也是一个开区间, \ell(\emptyset)=0. 这是因为,根据定义 (a,b)=\{x\in \mathbb R:x>a,x<b\}, 所以 (a,a)=\{x\in \mathbb R:x>a,x<a\}=\emptyset.
思考题: 用上面关于长度的直觉来判断,单个点 \{0\} 的长度是多少?三个点 \{1,2,3\} 的总长度是多少?作为 \mathbb R 的子集, \mathbb N 的长度“应该”是多少?有理数 \mathbb Q 的长度和 \mathbb N 一样吗?通过这样的方法还可以计算哪些集合的“长度”?如何才能把这些计算变成严格的定义?
未完待续……