扩展到整个 R n 上。

不是正常的凸函数就是不正常的(improper)。正常凸函数使我们要研究的对象,但是在许多情况下,正常函数会产生不正常函数并且接纳他们比费力地排除他们要更简便。这里给出一个定义在 上不正常凸函数的例子

f ( x ) = 0 + if | x | < 1 if | x | = 1 if | x | > 1

凸函数有一个重要的插值属性,根据定义, S 上的凸函数,当且仅当 ( x , μ ) , ( y , v ) 属于epi 并且 0 λ 1 时,下式

( 1 λ ) ( x , μ ) + λ ( y , v ) = ( ( 1 λ ) x + λ y , ( 1 λ ) μ + λ v )

属于epi 。换句话说,当 x S , y S , f ( x ) μ R , f ( y ) v R , 0 λ 1 ( 1 λ ) x + λ y S f ( ( 1 λ ) x + λ y ) ( 1 λ ) μ + λ v

这个条件可以用几种不同的方式表达,下面两种变形是非常有用的。

定理4.1 是从 C ( , + ] 的函数,其中 是凸集(例如 C = R n ),那么当且仅当对于 中所有 x , y 下式

f ( ( 1 λ ) x + λ y ) ( 1 λ ) f ( x ) + λ f ( y ) , 0 < λ < 1

成立时,函数 C 上是凸的。

定理4.2 是从 R n [ , + ] 的函数,那么当且仅当下式

f ( ( 1 λ ) x + λ y ) < ( 1 λ ) α + λ β , 0 < λ < 1

成立时,函数 在是凸的,其中 f ( x ) < α , f ( y ) < β

另一个有用的变形通过在上境图上应用定理2.2推出来。

定理4.3 (Jensen’s Inequality) 是从 R n ( , + ] 上的函数,那么对于 λ 1 0 , , λ m 0 , λ 1 + + λ m = 1 ,当且仅当下式

f ( λ 1 x 1 + + λ m x m ) λ 1 f ( x 1 ) + + λ m f ( x m )

当然,在同样的假设下,凹函数满足反向的不等式,仿射函数满足上面的等式,因此 R n 上的仿射函数是从 的仿射变换。

定理4.1中的不等式经常用来作为从凸集 C ( , + ] 为凸的定义,然而当 f 同时有 + , 时,这个方法就行不通了,因为产生了 。当然,定理4.2中的条件可以用来作为一般情况下凸的定义,但是本文开始给出的定义似乎更好,因为它强调了几何特征,这是凸函数理论的基础。

从下面的定理中我们可以得到一些实数轴上凸函数的经典实例。

定理4.4 令 是开区间 ( α , β ) 上二阶连续可导的实函数,那么当且仅当在 ( α , β ) 上它的二阶导 为非负时,

证明: 首先假设 f ′′ ( α , β ) 是非负的,那么 ( α , β ) 上是非递减的。对于 α < x < y < β , 0 < λ < 1 , z = ( 1 λ ) x + λ y f ( z ) f ( x ) = z x f ( t ) d t f ( z ) ( z x ) f ( y ) f ( z ) = y z f ( t ) d t f ( z ) ( y z ) z x = λ ( y x ) , y z = ( 1 λ ) ( y z ) ,所以我们有

f ( z ) f ( x ) + λ f ( z ) ( y x ) f ( z ) f ( y ) ( 1 λ ) f ( z ) ( y x )

上面两个不等式两边分别乘以 ( 1 λ ) , λ ,然后相加可得

( 1 λ ) f ( z ) + λ f ( z ) ( 1 λ ) f ( x ) + λ f ( y )

左边仅仅是 f ( z ) = f ( ( 1 λ ) x + λ y ) ,所以根据定理4.1这就证明了 ( α , β ) 上是凸的。现在考虑反向断言,假设 ( α , β ) 不是非负的,那么根据连续性,在某个子区间 ( α , β ) 将是负的,仿照前面的证明,在 ( α , β ) f ( z ) f ( x ) > f ( z ) ( z x ) f ( y ) f ( x ) > f ( z ) ( y x ) f ( ( 1 λ ) x + λ y ) > ( 1 λ ) f ( x ) + λ f ( y ) ( α , β ) 不是凸的。

定理4.4将在定理24.1和24.2中进行推广。

下面列举一些 上的函数,他们的凸性从定理4.4中可以退出来。

  • f ( x ) = e α x , where < α < f ( x ) = x p i f x 0 , f ( x ) = if x < 0 , where 1 p < f ( x ) = x p if x 0 , f ( x ) = if x < 0 , where 0 p 1 f ( x ) = x p if x > 0 , f ( x ) = if x 0 , where < p 0 f ( x ) = ( α 2 x 2 ) ( 1 / 2 ) if | x | < α , f ( x ) = if | x | α , where α > 0 f ( x ) = log x if x > 0 , f ( x ) = if x 0
  • 对于多维的情况,根据定理4.1可得所有形如

    f ( x ) = x , a + α , a R n , α R 上是凸的,事实上是仿射的。每个 上的仿射函数实际上都有这种形式(定理1.5),二次函数

    f ( x ) = 1 2 x , Q x + x , a + α n × n 的对称矩阵,要想是 上的凸函数,当且仅当 是半正定的即

    z , Q z 0 f o r e v e r y z R n

    下面关于定理4.4的多维版本可以直接得出

    定理4.5 R n 中开集 上的二阶连续可导实值函数,那么当且仅当Hessian矩阵

    Q x = ( q i j ( x ) ) , q i j ( x ) = 2 f ξ i ξ j ( ξ 1 , , ξ n )
    x C 是半正定时,

    证明: f 上的凸性等价于 f 中每条线段上的凸性,这和函数 g ( λ ) = f ( y + λ z ) 在开实数区间 { λ | y + λ z C } 的凸性是一样的,其中 y C , z R n 。通过简单的计算就得出

    g ′′ ( λ ) = z , Q x z , x = y + λ z

    因此根据定理4.4得,对于每个 x C , z R n ,当且仅当 z , Q x z 0 对于每个 y C , z R n 是凸的。 上有一个非常有趣的函数,它的凸性可以用定理4.5证明,那就是几何平均的负:

    f ( x ) = f ( ξ 1 , , ξ n ) { ( ξ 1 ξ 2 ξ n ) 1 / n + otherwise if ξ 1 0 , , ξ n 0

    直接计算得

    z , Q x z = n 2 f ( x ) [ ( Σ n j = 1 ζ j / ξ j ) 2 n Σ n j = 1 ( ζ j / ξ j ) 2 ] z = ( ζ 1 , , ζ n ) , x = ( ξ 1 , , ξ n ) , ξ 1 > 0 , , ξ n > 0 。 这个量是非负的,因为 f ( x ) < 0 并且对于任意实数 是半正定的时候是凸的(定理4.5),这种形式的集合包括所有实心椭圆体和抛物体,以及像 x , x 1 的球。

    定理4.6和推论4.6.1对于非线性不等式组理论非常重要,但是凸性也进入到不等式其他方面的分析,因为各种各样经典的不等式可以看成定理4.3的特殊情况,例如取 R 上的负对数,如上面的例6。对于正数 x 1 , , x m 的凸组合,根据定理4.3我们有

    log ( λ 1 x 1 + + λ m x m ) λ 1 log x 1 λ m log x m

    两边乘以-1然后取指数得

    λ 1 x 1 + + λ m x m x λ 1 1 x λ m m

    特别地,当 λ 1 = = λ

  •