第一次就能看懂的勒贝格（Lebesgue）积分（一）

2 年前 · 来自专栏第一次就能看懂的实分析

九度飞雪

数学；物理；古典音乐

如需转载，请务必注明出处，并附加本文链接。

前言

这份讲义的目标是：让没有学过黎曼积分的人学懂勒贝格积分。当然，我也希望这份讲义也可以给已经学过积分的同学带来一些新的思路。

讲义比较长，所以会分几次发布。如果想看后面的内容，可以“+关注”我并等待更新。新文章的链接会放在下面的目录里。

讲义的第二部分已经发布： 第一次就能看懂的勒贝格（Lebesgue）积分（二）：芝诺悖论

如果大家有疑问，可以写在评论里。

数学中，很多概念的定义都来源于我们对一些东西的直觉。其中一个例子是积分。我们知道长方形的面积是多少，并且对面积的概念有以下直观上的认识：

如果把两块图形无重叠地拼在一起，则总面积等于每部分的面积相加；
如果一个图形包含另一个图形，那么被包含的那个图形面积更小。

这些关于大小的认知几乎是与生俱来的，是原始人也大概率知道的， 虽然简单，但非常重要 。

用这些直觉，可以推断出很多不同的图形面积“应该”是多少：我们在小学课本里就见过这种推导。但是，这些规律含义并不确切。当我们尝试严格定义“面积”的概念，创造一个“积分”的理论时，会发现符合以上直觉的定义不止一种，而这些定义又不相互等价。因此，我们有很多不同的定义方式，很多不同的积分理论：现代分析学中最常用的是勒贝格（Lebesgue）积分，但是还有黎曼（Riemann）积分等其他 好几种 理论。每一种积分理论也可以用很多不同的，但是等价的方式建立。比如，达布（Darboux）积分就和黎曼积分等价。

我们第一次学积分的时候，通常学的是黎曼积分，但是勒贝格积分相比黎曼积分有以下优点（当然，以下这几点不是绝对的，不同的人可能有不同的看法）：

更加简洁。勒贝格积分的技术性细节要比黎曼积分少很多。黎曼积分理论中的证明经常会出现一大堆的 \epsilon/2 和 \epsilon/4. 勒贝格积分的证明中较少出现这样的细节（当然还是有的）。
更加直观。勒贝格积分有多种等价的定义，但 如果使用比较简洁的定义 ，则定义中几乎每一步都符合我们对面积的直觉，非常自然。黎曼积分总体上也非常符合直觉，但是很多细节都较难理解，难以留下深刻的印象。总体上来讲勒贝格积分更接近面积的本质。
更加“强大”。黎曼可积的函数一定勒贝格可积，而黎曼不可积的函数也有可能勒贝格可积（这里不包括反常积分）。
更容易处理二重积分、曲面积分等等。
勒贝格积分有更好的性质，在调和分析、偏微分方程、泛函分析中有广泛的应用。
勒贝格积分可以很容易地推广到其它抽象的数学结构上。

但是，勒贝格积分也更加抽象，会给学习造成一定的困难。讲勒贝格积分的书/课程通常会要求较高的基础知识，使没有学过积分的人望而却步。我们知道，勒贝格积分是“实变函数”这门课程的核心；经常有人说，这门课学了可数多遍还是几乎处处不懂。尽管如此，如果以合理的方式把每一步解释清楚，则会发现勒贝格积分的定义和构造其实非常自然，比黎曼积分更加简洁：这就是下面我们尝试做的事情。

当然，在有一些地方，黎曼积分的概念还是非常有用的，所以最后也会用 与勒贝格积分相似的方法介绍，以说明它们的联系 。

下面我会用尽量少的基础知识，从面积的直观几何意义出发，把积分的概念讲清楚。

关于参考： 大部分实分析的书都会涉及下面的很多内容，包括Walter Rudin的Real and Complex Analysis，以及Elias M. Stein, Rami Shakarchi的Real analysis: measure theory, integration, and Hilbert spaces. 当然这些书的内容会比这份讲义难一些。

前言
集合/函数/极限
最简单的积分
长度（一）
芝诺悖论（第一次就能看懂的勒贝格（Lebesgue）积分（二）：芝诺悖论）
长度（二）（等待更新）
勒贝格下积分（等待更新）
可测函数和积分（等待更新）
积分的简单性质（等待更新）
黎曼积分（等待更新）
结语（等待更新）

续集：

勒贝格测度的定义和性质：

勒贝格测度可加性的证明：

积分的定义：

集合/函数/极限

我们先复习一些基本概念。在下面所有的地方，符号 := 表示“定义为”。比如 f(x):=x+1 的含义为“将 f(x) 定义为 x+1 ”.

集合

对于常见的一些集合，我们用以下符号表示： \mathbb R 是实数集合， \mathbb Q 是有理数集合， \mathbb N=\{1,2,\ldots\} 是正整数集合。注意在这里 \mathbb N 不包括 0. 在其他的资料中， \mathbb N （自然数）的定义可能包含 0. 不同的作者可能有不同的定义。

集合有以下几种基本运算。

定义（集合的基本运算）：

设 X 为一个集合， A_j \subseteq X, j=1,2,\ldots 是一些子集。我们称 X 为全集；它包含了我们关心的所有元素。

并集： 定义

\bigcup_{j=1}^\infty A_j := \{x\in X: \exists j\in\mathbb N, x\in A_j\}\\

其中 \exists j\in\mathbb N, x\in A_j 含义为“存在 j 使得 x \in A_j ”. 所有满足这个条件的 x 属于这个并集。

交集： 定义

\bigcap_{j=1}^\infty A_j :=\{x\in X: \forall j\in\mathbb N, x\in A_j\}\\

其中 \forall j 表示“对所有的 j ”.

差集： 我们定义 A\backslash B := \{x\in X: x\in A,x\notin B\}.

补集（Complement） : 我们将 E 的补集 E^c 定义为 E^c = X\backslash E.

关于集合之间的函数（映射），我们有如下定义（ 非常重要 ）：

定义（单射、满射、双射、像、逆像等等）：

设是两个集合。如果有一个 X,Y 之间的对应关系 f 使得每一个 x\in X 都与唯一的一个 y\in Y 对应，则称 f 为一个函数或者映射，记为 f:X\to Y. 其中 X 是 f 的 定义域 ， Y 是 f 的 上域(codomain) 。
如果 A\subseteq X, B\subseteq Y, 则我们定义 A 的 像(image) 为 f(A):= \{f(x):x\in A\}, 定义 B 的 逆像(inverse image) 为 f^{-1}(B):=\{x\in X:f(x)\in B\}. 我们定义函数 f 的像为 f(X), 即整个定义域的像。 f(X) 是 Y 的子集，但不一定等于 Y.
我们说 f 是单射，如果 \forall x_1,x_2\in X,f(x_1)=f(x_2) 当且仅当 x_1=x_2. 我们说 f 是满射，如果对于所有的 y\in Y 我们都有 x\in X, 使得 f(x)=y. 如果 f 既是单射也是满射，则说 f 是双射。
设 f,g:\mathbb R\to \mathbb R 是两个函数。如果对于所有的 x\in\mathbb R, f(x)\leq g(x) 则我们说 f\leq g.

另外，我们有特征函数的概念。

定义： 设 E\subseteq X, 则我们定义 E 的 特征函数 \mathbf 1_E: X \to \{0,1\},

\mathbf 1_E (x)=\begin{cases} 0, x \notin E;\\ 1, x\in E. \end{cases}\\

特征函数的值告诉我们 x 是否在 E 中：输出 1 代表“是”， 0 代表“否”。

“可数”是一个常用的，描述集合大小的概念。

定义： 我们说一个集合 X 可数，如果 X 中的元素可以与全体正整数 \mathbb N 建立一一对应，即存在一个双射 f:\mathbb N \to X. 简单来说，就是 X 中的元素可以这样列出来：

x_1,x_2,x_3,\ldots\\ 这里 x_n 是 n\in \mathbb N 所对应的 X 中的元素： x_n=f(n).

比如，如果有无穷多个实数，记为 \{c_1,c_2,\ldots,c_n,\ldots\}, （每一个正整数都对应一个实数）则我们说 有可数多个实数 。

可数集合是“最小”的无穷集合。如果一个集合可数，说明它和 \mathbb N 一样“大”，而不能更大。

例： \mathbb N 是可数的； \mathbb Z 和 \mathbb N \times \mathbb N=\{(n_1,n_2):n_1,n_2\in \mathbb N\} 都是可数的。 \mathbb Q 是可数的，但 \mathbb R 不可数。

证明： 显然 \mathbb N 可以和自己建立一一对应。我们可以这样列出 \mathbb Z 的所有元素：

0,1,-1,2,-2,3,-3,4,-4,\ldots\\ 如果我们把这个序列的第 n 项与正整数 n 对应，则会得到一个双射 f:\mathbb Z \to \mathbb N, f(0)=1,f(1)=2,f(-1)=3,

f(x)= \begin{cases} 1, \text{当$x=0$时，} \\ 2x，\text{当$x>0$时，}\\ -2x+1，\text{当$x<0$时.} \end{cases}

对于 \mathbb N \times \mathbb N, 我们同样可以以如下的方式列出所有这个集合中的元素：

(1,1),(2,1),(1,2),(3,1),(2,2),(1,3),(4,1),(3,2),(2,3),(1,4),(5,1),\ldots\\ 如果我们把这个序列的第 n 项与正整数 n 对应，则也可以建立一一对应。具体的函数表达式这里就略去了。

\mathbb Q 的证明也类似：我们可以以同样的方式列出所有的有理数

0,1,-1,\frac21,\frac12,-\frac21,-\frac12, \frac31,\frac22,\frac13,-\frac31,-\frac22,-\frac13,\frac41,\frac32,\frac23,\frac14,\\ -\frac41,-\frac32,-\frac23,-\frac14, \ldots

但是这里有重复的数，比如 1=\frac22. 因此，我们删掉所有第二次出现的数，第三次出现的数，第四次……等等。于是我们去除了所有的重复：每个数只会出现一次。

0,1,-1,\frac21,\frac12,-\frac21,-\frac12, \frac31,\frac13,-\frac31,-\frac13,\frac41,\frac32,\frac23,\frac14,\\ -\frac41,-\frac32,-\frac23,-\frac14, \ldots

如果我们把这个序列的第 n 项与正整数 n 对应，则建立了一一对应。

可以用Cantor对角线法证明实数集合 \mathbb R 是不可数的，但是这个结论在下面并不会用到，所以这里将证明略去。 \square

实数、无穷大、和级数

为了更方便地处理无穷，我们引入扩展的实数集合 {\mathbb R} ^\ast= \mathbb R \cup \{-\infty,+\infty\}=[-\infty,+\infty]. 现在可以规定一些关于无穷的运算：如果 a\in \mathbb R, a>0, 则

+\infty+a=a+\infty=+\infty, -\infty+a=a-\infty=-\infty, \\ a\cdot (-\infty)=(-a)\cdot (+\infty)=-\infty, a\cdot (+\infty)=(-a)\cdot (-\infty)=+\infty,

而 +\infty-\infty 则没有定义。另外，无穷大和实数之间可以比较大小： -\infty <-a, a<+\infty.

最重要的一点是：我们规定 0\cdot(\pm \infty) =0. 这看起来并不总是符合我们对无穷的认识 ，但是可以让后面的理论变得简单有效。

第一次学数学分析的时候，可能会强调“不要把无穷大当成一个数来运算、比较大小”。 但是，这里我们有必要做出上面的规定 ，因为这样可以简化很多符号和陈述，帮助我们抓住很多问题的重点。

设是 (x_n)_{n\in \mathbb N} 可数多个非负实数。则我们定义所有的 x_n 和为

\sum_{n\in \mathbb N} x_n=\sum_{n=1}^\infty x_n,\\

可以证明：若级数收敛，则这个和的值与 x_n 的顺序无关。若级数发散，则不论如何排序，级数都发散。

这里我们约定：如果级数发散，则和为 +\infty. 因此， 不管两个非负级数是否收敛， 不等式

\sum_{n} a_n \leq \sum_n b_n\\ 都有意义。其含义是：如果 \sum a_n,\sum b_n 均收敛，则 a_n 的和小于或等于 b_n 的和，并且如果 \sum a_n 发散，则 \sum b_n 发散。所以当 \sum b_n 发散时，不论 a_n 为何值，这个不等式都成立。注意： 以上只对非负级数有效 。

最小上界

讨论积分时，我们会用到一个集合 A\subseteq \mathbb R 的“最大值”和“最小值”的思想；但是我们知道，集合中最大/最小的元素可能 不存在 。比如，不存在最小的正实数（没有最小、只有更小），但是正数集合的“底部”是 0. 所以，我们要使用以下概念来代替“最大值”和“最小值”：上确界、下确界总是存在的。

定义: 设 A\subseteq \mathbb R 是一个上有界的集合（即存在 M\in \mathbb R 使得 A 中的每一个数都小于或等于 M ）。如果一个实数 s 满足以下两个条件：

对于任意的 x\in A, x\leq s.
不论 \epsilon >0 有多小，总存在 x\in A, 使得 |x-s|<\epsilon. 即： A 中的数可以无限接近于 s.

则称 s 为 A 的 最小上界 ，又称为 上确界 ，记为 s=\sup A.

可以证明确实是所有上界里最小的，因为它正好在集合的“顶端”。另外，如果 A 是上无界的（即不是上有界的），则可以说 \sup A =+\infty.

用类似的方法可以定义集合的最大下界（下确界）。

定义: 设 A\subseteq \mathbb R 是一个下有界的集合。如果一个实数 s 满足以下两个条件：

对于任意的 x\in A,x\geq s.
不论 \epsilon >0 有多小，总存在 x\in A, 使得 |x-s|<\epsilon.

则称 s 为 A 的下确界，记为 s=\inf A. 如果 A 是下无界的，则可以说 \inf A =-\infty.

根据实数理论，任何一个的非空子集的上确界、下确界存在（有可能是 \pm\infty ）且唯一。

最简单的积分

考虑这样的一个函数： f(x) = \sum_{j=1}^n c_j \mathbf 1_{[a_j,b_j)}=\begin{cases} c_1, x\in[a_1,b_1),\\c_2, x\in[a_2,b_2),\\ \vdots\\ c_n, x\in[a_n,b_n);\\ 0, \text{对于其他$x$的值}.\end{cases}\\

其中 a_1<b_1\leq a_2 <b_2 \leq \ldots <b_n,c_j\geq0. 人类的本能告诉我们， f(x) 的图像和 x 轴之间的面积由若干个矩形构成，而每个矩形的面积为 c_j(b_j-a_j). 所以，总面积(记为 \int f )是 \int f= \sum_{j=1}^n c_j(b_j-a_j).\\

不管以何种方式定义积分 ，这个式子都应当成立，否则积分就不符合我们对面积的直观感受了。

注意上面的面积公式有两个要素： “高度” c_j 以及“长度/宽度” b_j-a_j. 我们下面来讨论这两个概念。

长度（一）

我们现在尝试定义的子集的长度。 开头提到的对面积的直觉对长度也适用。 直觉上， [0,2] 这个区间的长度为 2, 集合 (0,1)\cup (5,8) 的长度为 1+3=4. 以这种方式，我们可以得到很多不同的集合的长度。我们也可以使用无穷级数推广长度的概念。如果我们有可数多个 互不相交 的区间 (I_j)_{j=1}^\infty, 其中每个可能是开区间 (a_j,b_j), 闭区间 [a,b], 或者半开半闭区间 [a_j,b_j),(a_j,b_j]. 我们知道， I_j 的“长度”是 \ell(I_j)=b_j-a_j. 现在，如果 E=\bigcup_{j=1}^\infty I_j,\\ 那么我们可以定义的长度为（注意现在只是在尝试，还没有确定如何定义）：

\ell(E):=\sum_{j=1}^\infty (b_j-a_j)=\sum_{j=1}^\infty\ell(I_j).\\ 如果级数发散，则长度是 +\infty.

这里顺便说一下，空集 \emptyset=(0,0)=(a,a) 也是一个开区间, \ell(\emptyset)=0. 这是因为，根据定义 (a,b)=\{x\in \mathbb R:x>a,x<b\}, 所以 (a,a)=\{x\in \mathbb R:x>a,x<a\}=\emptyset.

思考题： 用上面关于长度的直觉来判断，单个点 \{0\} 的长度是多少？三个点 \{1,2,3\} 的总长度是多少？作为 \mathbb R 的子集， \mathbb N 的长度“应该”是多少？有理数 \mathbb Q 的长度和 \mathbb N 一样吗？通过这样的方法还可以计算哪些集合的“长度”？如何才能把这些计算变成严格的定义？

未完待续……

编辑于 2021-03-15 06:05

前言

目录

集合

实数、无穷大、和级数

最小上界

最简单的积分

长度 （一）

文章被以下专栏收录

第一次就能看懂的实分析

长度（一）