Jensen不等式的形式有很多种,这里重点关注有关于随机变量期望的形式。

1 Jensen不等式

Jensen不等式 :已知函数 \(\phi: \mathbb{R}\to\mathbb{R}\) 为凸函数,则有 \(\phi[\text{E}(X)]\leq \text{E}[\phi(X)]\)

有时候,需要用到离散形式的Jensen不等式: \(\{a_j\}\) 是一系列非负权重,满足 \(\sum_{j=1}^m a_j=1\) \(\{x_j\}\) 是一系列任意实数,对于凸函数 \(\phi: \mathbb{R}\to\mathbb{R}\) ,有

\[\phi\left(\sum_{j=1}^m a_j x_j\right) \leq \sum_{j=1}^m a_j \phi(x_j) \]

只需将原期望形式的Jensen不等式中的随机变量取成离散的,并令 \(P(X=x_j)=a_j\) ,即可得到上式。

2 条件Jensen不等式

将不等式两边的期望都取为条件期望的形式,不等式依然成立。

条件Jensen不等式 :已知函数 \(\phi: \mathbb{R}\to\mathbb{R}\) 为凸函数,则有 \(\phi[\text{E}(X|Y)]\leq \text{E}[\phi(X)|Y]\)

来看一个应用:在 \(\text{Var}(X)<\infty\) 的条件下,利用条件Jensen不等式,可以证明 \(\text{Var}[\text{E}(X|Y)]\leq \text{Var}(X)\)

证明如下:

\[\begin{aligned} &[\text{E}(X|Y)-\text{E}(X)]^2 \\ =& [\text{E}(X|Y)]^2+[\text{E}(X)]^2 - 2\text{E}(X|Y)\text{E}(X)\\ \leq & \text{E}(X^2|Y)+[\text{E}(X)]^2 - 2\text{E}(X|Y)\text{E}(X) \end{aligned} \]

两边取期望后,可得

\[\begin{aligned} &\text{E}\left\{\left\{\text{E}(X|Y)-\text{E}[\text{E}(X|Y)]\right\}^2\right\} \\ (= & \text{Var}[\text{E}(X|Y)])\\ \leq & \text{E}[\text{E}(X^2|Y)]+[\text{E}(X)]^2 - 2[\text{E}(X)]^2\\ = & \text{E}(X^2)+[\text{E}(X)]^2 - 2[\text{E}(X)]^2\\ = & \text{Var}(X) \end{aligned} \]

得证。

3 Jensen不等式的应用

许许多多不等式,都可以利用Jensen不等式得出,这里整理一些例子。

3.1 套用简单函数

\(\phi\) 直接取为简单的凸函数或凹函数,就可以得到许多不等式:

  • \([\text{E}(X)]^2 \geq \text{E}(X^2)\)
  • \(|\text{E}(X)|\leq \text{E}|X|\)
  • \(\exp[\text{E}(X)]\leq \text{E}[\exp(X)]\)
  • \(\text{E}[\log(X)]\leq \log[\text{E}(X)]\)
  • \(\text{E}[X^{1/2}]\leq [\text{E}(X)]^{1/2}\)
  • 3.2 Lyapunov不等式

    Lyapunov不等式 :对于任意 \(0\leq p \leq q\) ,有

    \[[\text{E}(|X|^{p})]^{1/p} \leq [\text{E}(|X|^{q})]^{1/q} \]

    证明过程,只需利用凸函数 \(\phi(x)=x^{q/p}\) ,和随机变量 \(Y=|X|^q\) 即可。

    3.3 几何均值不等式

    几何均值不等式 (Geometric Mean Inequality): \(\{a_j|\) 是一系列非负权重,满足 \(\sum_{j=1}^m a_j=1\) \(\{x_j\}\) 是一系列任意的 非负 实数,则有

    \[x_1^{a_1}x_2^{a_2}\cdots x_m^{a_m}\leq \sum_{j=1}^m a_j x_j \]

    证明要用到离散形式的Jensen不等式,将 \(\phi\) 取为对数函数即可,由于对数函数是凹函数,不等式需反向。

    如果取 \(m=2\) \(a_1=a_2=\dfrac{1}{2}\) ,就是在中学阶段熟悉的 \(\sqrt{x_1 x_2}\leq \dfrac{x_1+x_2}{2}\) ,即几何均值小于等于代数均值。

    3.4 Loeve’s \(C_r\) Inequality

    对于一系列的任意实数 \(x_j\) ,有

    \[\left| \sum_{j=1}^m x_j \right|^r \leq \begin{cases} \sum\limits_{j=1}^m |x_j|^r&,0\lt r\leq 1\\ m^{r-1} \sum\limits_{j=1}^m |x_j|^r&, r\gt 1 \end{cases} \]

    \(m=2\) 时,记 \(C_r=\max\{1,2^{r-1}\}\) ,该不等式可写为

    \[|a+b|^r\leq C_r \left(|a|^r+|b|^r\right) \]

    因此也叫 \(C_r\) 不等式。

    证明同样需用到离散形式Jensen不等式。若 \(r\gt 1\) ,取 \(a_j=1/m\) \(\phi(x)=|x|^r\) ,即可得证。若 \(r\leq 1\) ,记 \(\sum_{j=1}^m |x_j|=A\) ,取 \(b_j=|x_j|/A\) ,则 \(b_j\in [0,1]\) ,因此有 \(b_j\leq b_j^r\) ,因此

    \[1=\sum_{j=1}^m b_j\leq \sum_{j=1}^m b_j^r=\dfrac{\sum_{j=1}^m |x_j|^r}{A^r} \]

    再利用 \(|\sum_{j=1}^m x_j |\leq \sum_{j=1}^m |x_j|=A\) ,即可得证。

    3.5 范数不等式

    范数不等式 :对于 \(0\lt p\leq q\) ,有

    \[\left| \sum_{j=1}^m |x_j|^q \right|^{1/q} \leq\left| \sum_{j=1}^m |x_j|^p \right|^{1/p} \]

    \(r=p/q\leq 1\) \(y_j=|x_j|^q\) ,利用上一节中的 \(C_r\) 不等式,可得

    \[\left| \sum_{j=1}^m y_j \right|^r \leq \sum_{j=1}^m |y_j|^r \]

    \(x_j\) 代回并两边取 \(1/p\) 次方即可得证。

    同名公众号:分析101