第一次就能看懂的勒贝格(Lebesgue)积分(一)

第一次就能看懂的勒贝格(Lebesgue)积分(一)

2 年前 · 来自专栏 第一次就能看懂的实分析

如需转载,请务必注明出处,并附加本文链接。

前言

这份讲义的目标是:让没有学过黎曼积分的人学懂勒贝格积分。当然,我也希望这份讲义也可以给已经学过积分的同学带来一些新的思路。

讲义比较长,所以会分几次发布。如果想看后面的内容,可以“+关注”我并等待更新。新文章的链接会放在下面的目录里。

讲义的第二部分已经发布: 第一次就能看懂的勒贝格(Lebesgue)积分(二):芝诺悖论

如果大家有疑问,可以写在评论里。

数学中,很多概念的定义都来源于我们对一些东西的直觉。其中一个例子是积分。我们知道长方形的面积是多少,并且对面积的概念有以下直观上的认识:

  • 如果把两块图形无重叠地拼在一起,则总面积等于每部分的面积相加;
  • 如果一个图形包含另一个图形,那么被包含的那个图形面积更小。

这些关于大小的认知几乎是与生俱来的,是原始人也大概率知道的, 虽然简单,但非常重要

用这些直觉,可以推断出很多不同的图形面积“应该”是多少:我们在小学课本里就见过这种推导。但是,这些规律含义并不确切。当我们尝试严格定义“面积”的概念,创造一个“积分”的理论时,会发现符合以上直觉的定义不止一种,而这些定义又不相互等价。因此,我们有很多不同的定义方式,很多不同的积分理论:现代分析学中最常用的是勒贝格(Lebesgue)积分,但是还有黎曼(Riemann)积分等其他 好几种 理论。每一种积分理论也可以用很多不同的,但是等价的方式建立。比如,达布(Darboux)积分就和黎曼积分等价。

我们第一次学积分的时候,通常学的是黎曼积分,但是勒贝格积分相比黎曼积分有以下优点(当然,以下这几点不是绝对的,不同的人可能有不同的看法):

  1. 更加简洁。勒贝格积分的技术性细节要比黎曼积分少很多。黎曼积分理论中的证明经常会出现一大堆的 \epsilon/2 \epsilon/4. 勒贝格积分的证明中较少出现这样的细节(当然还是有​的)。
  2. 更加直观。勒贝格积分有多种等价的定义,但 如果使用比较简洁的定义 ,则定义中几乎每一步都符合我们对面积的直觉,非常自然。黎曼积分总体上也非常符合直觉,但是很多细节都较难理解,难以留下深刻的印象。总体上来讲勒贝格积分更接近面积的本质。
  3. 更加“强大”。黎曼可积的函数一定勒贝格可积,而黎曼不可积的函数也有可能勒贝格可积(这里不包括反常积分)。
  4. 更容易处理二重积分、曲面积分等等。
  5. 勒贝格积分有更好的性质,在调和分析、偏微分方程、泛函分析中有广泛的应用。
  6. 勒贝格积分可以很容易地推广到其它抽象的数学结构上。

但是,勒贝格积分也更加抽象,会给学习造成一定的困难。讲勒贝格积分的书/课程通常会要求较高的基础知识,使没有学过积分的人望而却步。 我们知道,勒贝格积分是“实变函数”这门课程的核心;经常有人说,这门课学了可数多遍还是几乎处处不懂。尽管如此,如果以合理的方式把每一步解释清楚,则会发现勒贝格积分的定义和构造其实非常自然,比黎曼积分更加简洁:这就是下面我们尝试做的事情。

当然,在有一些地方,黎曼积分的概念还是非常有用的,所以最后也会用 与勒贝格积分相似的方法介绍,以说明它们的联系

下面我会用尽量少的基础知识,从面积的直观几何意义出发,把积分的概念讲清楚。

关于参考: 大部分实分析的书都会涉及下面的很多内容,包括Walter Rudin的Real and Complex Analysis,以及Elias M. Stein, Rami Shakarchi的Real analysis: measure theory, integration, and Hilbert spaces. 当然这些书的内容会比这份讲义难一些。

目录

  1. 前言
  2. 集合/函数/极限
  3. 最简单的积分
  4. 长度(一)
  5. 芝诺悖论( 第一次就能看懂的勒贝格(Lebesgue)积分(二):芝诺悖论
  6. 长度(二)(等待更新)
  7. 勒贝格下积分(等待更新)
  8. 可测函数和积分(等待更新)
  9. 积分的简单性质(等待更新)
  10. 黎曼积分(等待更新)
  11. 结语(等待更新)

续集:

勒贝格测度的定义和性质:

勒贝格测度可加性的证明:

积分的定义:


集合/函数/极限

我们先复习一些基本概念。在下面所有的地方,符号​ := 表示“定义为”。比如 f(x):=x+1 ​的含义为“将 f(x) ​定义为 x+1 ​”.

集合

对于常见的一些集合,我们用以下符号表示: \mathbb R ​是实数集合,​ \mathbb Q 是有理数集合, \mathbb N=\{1,2,\ldots\} ​是正整数集合。注意在这里 \mathbb N ​不包括​ 0. 在其他的资料中,​ \mathbb N (自然数)的定义可能包含 0. ​ 不同的作者可能有不同的定义。

集合有以下几种基本运算。

定义(集合的基本运算):

X ​为一个集合,​ A_j \subseteq X, j=1,2,\ldots 是一些子集。我们称 X ​为 全集 ;它包含了我们关心的所有元素。

并集: 定义

\bigcup_{j=1}^\infty A_j := \{x\in X: \exists j\in\mathbb N, x\in A_j\}\\

其中​ \exists j\in\mathbb N, x\in A_j 含义为“存在 j ​使得​ x \in A_j ”. 所有满足这个条件的 x ​属于这个并集。

交集: 定义

\bigcap_{j=1}^\infty A_j :=\{x\in X: \forall j\in\mathbb N, x\in A_j\}\\

其中 \forall j ​表示“对所有的 j ​”.

差集: 我们定义​ A\backslash B := \{x\in X: x\in A,x\notin B\}.

补集(Complement) : 我们将 E ​的补集​ E^c 定义为 E^c = X\backslash E.


关于集合之间的函数(映射),我们有如下定义( 非常重要 ):

定义(单射、满射、双射、像、逆像等等):

  1. 设​是两个集合。如果有一个 X,Y ​之间的对应关系​ f 使得每一个​ x\in X 都与 唯一 的一个 y\in Y ​对应,则称 f ​为一个函数或者映射,记为 f:X\to Y. ​ 其中​ X f ​的 定义域 ,​ Y 是​ f 上域(codomain)
  2. 如果 A\subseteq X, B\subseteq Y, ​ 则我们定义​ A 像(image) f(A):= \{f(x):x\in A\}, ​ 定义​ B 逆像(inverse image) f^{-1}(B):=\{x\in X:f(x)\in B\}. ​ 我们定义函数 f ​的 f(X), ​ 即整个定义域​的像。 f(X) ​是 Y ​的子集,但不一定等于​ Y.
  3. 我们说 f ​是 单射 ,如果 \forall x_1,x_2\in X,f(x_1)=f(x_2) ​当且仅当​ x_1=x_2. 我们说 f ​是 满射 ,如果对于所有的​ y\in Y 我们都有 x\in X, ​使得​ f(x)=y. 如果 f 既是单射也是满射,则说 f 双射
  4. f,g:\mathbb R\to \mathbb R ​是两个函数。如果对于所有的​ x\in\mathbb R, f(x)\leq g(x) ​ 则我们说 f\leq g.


另外,我们有特征函数的概念。

定义: 设​ E\subseteq X, 则我们定义​ E 特征函数 \mathbf 1_E: X \to \{0,1\},

\mathbf 1_E (x)=\begin{cases} 0, x \notin E;\\ 1, x\in E. \end{cases}\\

特征函数的值告诉我们 x ​是否在 E ​中:输出 1 ​代表“是”, 0 ​代表“否”。


“可数”是一个常用的,描述集合大小的概念。

定义: 我们说一个集合​ X 可数,如果 X ​中的元素可以与全体正整数​ \mathbb N 建立一一对应,即存在一个双射​ f:\mathbb N \to X. 简单来说,就是​ X 中的元素可以这样列出来:

x_1,x_2,x_3,\ldots\\ 这里 x_n ​是 n\in \mathbb N ​所对应的 X ​中的元素:​ x_n=f(n).


比如,如果有无穷多个实数,记为 \{c_1,c_2,\ldots,c_n,\ldots\}, ​ (每一个正整数​都对应一个实数)则我们说 有可数多个实数

可数集合是“最小”的无穷集合。如果一个集合可数,说明它和 \mathbb N ​一样“大”,而不能更大。

例: \mathbb N 是可数的; \mathbb Z 和​ \mathbb N \times \mathbb N=\{(n_1,n_2):n_1,n_2\in \mathbb N\} 都是可数的。​ \mathbb Q 是可数的,但 \mathbb R ​不可数。

证明: ​显然 \mathbb N 可以和自己建立一一对应。我们可以这样列出 \mathbb Z ​的所有元素:

0,1,-1,2,-2,3,-3,4,-4,\ldots\\ 如果我们把这个序列的第 n ​项与正整数 n ​对应,则会得到一个双射​ f:\mathbb Z \to \mathbb N, f(0)=1,f(1)=2,f(-1)=3,

f(x)= \begin{cases} 1, \text{当$x=0$时,} \\ 2x,\text{当$x>0$时,}\\ -2x+1,\text{当$x<0$时.} \end{cases}

对于​ \mathbb N \times \mathbb N, 我们同样可以以如下的方式列出 所有 这个集合中的元素:

(1,1),(2,1),(1,2),(3,1),(2,2),(1,3),(4,1),(3,2),(2,3),(1,4),(5,1),\ldots\\ 如果我们把这个序列的第 n ​项与正整数 n ​对应,则也可以建立一一对应。具体的函数表达式这里就略去了。

\mathbb Q 的证明也类似:我们可以以同样的方式列出所有的有理数

0,1,-1,\frac21,\frac12,-\frac21,-\frac12, \frac31,\frac22,\frac13,-\frac31,-\frac22,-\frac13,\frac41,\frac32,\frac23,\frac14,\\ -\frac41,-\frac32,-\frac23,-\frac14, \ldots

但是这里有重复的数,比如​ 1=\frac22. 因此,我们删掉所有第二次出现的数,第三次出现的数,第四次……等等。于是我们去除了所有的重复:每个数只会出现一次。

0,1,-1,\frac21,\frac12,-\frac21,-\frac12, \frac31,\frac13,-\frac31,-\frac13,\frac41,\frac32,\frac23,\frac14,\\ -\frac41,-\frac32,-\frac23,-\frac14, \ldots

如果我们把这个序列的第 n ​项与正整数​ n 对应,则建立了一一对应。

可以用Cantor对角线法证明实数集合​ \mathbb R 是不可数的,但是这个结论在下面并不会用到,所以这里将证明略去。 \square

实数、无穷大、和级数

为了更方便地处理无穷,我们引入扩展的实数集合 {\mathbb R} ^\ast= \mathbb R \cup \{-\infty,+\infty\}=[-\infty,+\infty]. 现在可以规定一些关于无穷的运算:如果 a\in \mathbb R, a>0,

+\infty+a=a+\infty=+\infty, -\infty+a=a-\infty=-\infty, \\ a\cdot (-\infty)=(-a)\cdot (+\infty)=-\infty, a\cdot (+\infty)=(-a)\cdot (-\infty)=+\infty,

+\infty-\infty 则没有定义。另外,无穷大和实数之间可以比较大小: -\infty <-a, a<+\infty.

最重要的一点是:我们规定 0\cdot(\pm \infty) =0. 这看起来并不总是符合我们对无穷的认识 ,但是可以让后面的理论变得简单有效。

第一次学数学分析的时候,可能会强调“不要把无穷大当成一个数来运算、比较大小”。 但是,这里我们有必要做出上面的规定 ,因为这样可以简化很多符号和陈述,帮助我们抓住很多问题的重点。

设​是 (x_n)_{n\in \mathbb N} 可数多个非负实数。则我们定义所有​的 x_n 和为

\sum_{n\in \mathbb N} x_n=\sum_{n=1}^\infty x_n,\\

可以证明:若级数收敛,则这个和的值与​ x_n 的顺序无关。若级数发散,则不论如何排序,级数​都发散。

这里我们 约定 :如果级数发散,则和为 +\infty. ​ 因此, 不管两个非负级数​是否收敛, 不等式

\sum_{n} a_n \leq \sum_n b_n\\ 都有意义。其含义是:如果​ \sum a_n,\sum b_n 均收敛,则 a_n ​的和小于或等于​ b_n 的和, 并且 如果 \sum a_n ​发散,则​ \sum b_n 发散。所以当 \sum b_n ​发散时,不论 a_n ​为何值,这个不等式都成立。注意: 以上只对非负级数有效

最小上界

讨论积分时,我们会用到一个集合 A\subseteq \mathbb R 的“最大值”和“最小值”的思想;但是我们知道,集合中最大/最小的元素可能 不存在 。比如,不存在最小的正实数(没有最小、只有更小),但是正数集合的“底部”是 0. 所以,我们要使用以下概念来代替“最大值”和“最小值”:上确界、下确界总是存在的。

定义: A\subseteq \mathbb R 是一个上有界的集合(即存在 M\in \mathbb R 使得 A 中的每一个数都小于或等于 M )。​ 如果一个实数 s ​满足以下两个条件:

  • 对于任意的​ x\in A, x\leq s.
  • 不论 \epsilon >0 ​有多小,总存在​ x\in A, 使得 |x-s|<\epsilon. ​ 即: A ​中的数可以无限接近于 s.

则称​ s 为​ A 最小上界 ,又称为 上确界 ,记为​ s=\sup A.


可以证明​确实是所有上界里最小的,因为它正好在集合​的“顶端”。另外,如果 A 是上无界的(即不是上有界的),则可以说 \sup A =+\infty.

用类似的方法可以定义集合的最大下界(下确界)。

定义: 设​ A\subseteq \mathbb R 是一个下有界的集合。如果一个实数 s ​满足以下两个条件:

  • 对于任意的​ x\in A,x\geq s.
  • 不论 \epsilon >0 ​有多小,总存在​ x\in A, 使得​ |x-s|<\epsilon.

则称 s ​为​ A 的下确界,记为 s=\inf A. ​ 如果 A 是下无界的,则可以说 \inf A =-\infty.


根据实数理论,任何一个​的非空子集的上确界、下确界存在(有可能是​ \pm\infty )且唯一。


最简单的积分

考虑这样的一个函数: f(x) = \sum_{j=1}^n c_j \mathbf 1_{[a_j,b_j)}=\begin{cases} c_1, x\in[a_1,b_1),\\c_2, x\in[a_2,b_2),\\ \vdots\\ c_n, x\in[a_n,b_n);\\ 0, \text{对于其他$x$的值}.\end{cases}\\

其中​ a_1<b_1\leq a_2 <b_2 \leq \ldots <b_n,c_j\geq0. 人类的本能告诉我们,​ f(x) 的图像和​ x 轴之间的面积由若干​个矩形构成,而每个矩形的面积为​ c_j(b_j-a_j). 所以,总面积(记为​ \int f )是 \int f= \sum_{j=1}^n c_j(b_j-a_j).\\

不管以何种方式定义积分 ,这个式子都应当成立,否则积分就不符合我们对面积的直观感受了。

注意上面的面积公式有两个要素: “高度”​ c_j 以及“长度/宽度” b_j-a_j. ​ 我们下面来讨论这两个概念。

长度 (一)

我们现在 尝试 定义​的子集的长度。 开头提到的对面积的直觉对长度也适用。 直觉上,​ [0,2] 这个区间的长度为 2, ​ 集合 (0,1)\cup (5,8) ​的长度为​ 1+3=4. 以这种方式,我们可以得到很多不同的集合的长度。我们也可以使用无穷级数推广长度的概念。如果我们有 可数 多个 互不相交 的区间​ (I_j)_{j=1}^\infty, 其中每个​可能是开区间 (a_j,b_j), 闭区间 [a,b], ​或者半开半闭区间 [a_j,b_j),(a_j,b_j]. ​ 我们知道, I_j ​的“长度”是​ \ell(I_j)=b_j-a_j. 现在,如果 E=\bigcup_{j=1}^\infty I_j,\\ 那么我们可以定义​的长度为(注意现在只是在尝试,还没有确定如何定义):

\ell(E):=\sum_{j=1}^\infty (b_j-a_j)=\sum_{j=1}^\infty\ell(I_j).\\ 如果级数发散,则长度是​ +\infty.

这里顺便说一下,空集 \emptyset=(0,0)=(a,a) ​也是一个开区间, \ell(\emptyset)=0. 这是因为,根据定义 (a,b)=\{x\in \mathbb R:x>a,x<b\}, ​ 所以​ (a,a)=\{x\in \mathbb R:x>a,x<a\}=\emptyset.

思考题: 用上面关于长度的直觉来判断,单个点 \{0\} ​的长度是多少?三个点​ \{1,2,3\} 的总长度是多少?​作为 \mathbb R ​的子集, \mathbb N 的长度“应该”是多少?有理数 \mathbb Q ​的长度和 \mathbb N ​一样吗?通过这样的方法还可以计算哪些集合的“长度”?如何才能把这些计算变成严格的定义?

未完待续……

编辑于 2021-03-15 06:05

文章被以下专栏收录

    第一次就能看懂的实分析

    第一次就能看懂的实分析

    用简单、直接的方式把抽象的概念讲清楚