1. 定义
1.1 上凸函数
-
如果对任意 x1、x2 总有 f[αx1+(1−α)x2]≥αf(x1)+(1−α)f(x2),其中 0≤α≤1,则称 f(x) 为上凸函数。
-
如果对任意 x1、x2 且 x1=x2,总有 f[αx1+(1−α)x2]>αf(x1)+(1−α)f(x2),其中 0<α<1,则称 f(x) 为严格上凸函数。
1.2 下凸函数
-
如果对任意 x1、x2 总有 f[αx1+(1−α)x2]≤αf(x1)+(1−α)f(x2),其中 0≤α≤1,则称 f(x) 为下凸函数。
-
如果对任意 x1、x2 且 x1=x2,总有 f[αx1+(1−α)x2]<αf(x1)+(1−α)f(x2),其中 0<α<1,则称 f(x) 为严格下凸函数。
2. 琴生(Jenson)不等式
-
对于上凸函数,f(E[X])≥E[f(x)] 或 k=1∑qλkf(xk)≤f(k=1∑qλkxk) ,其中 λ1,λ2,⋯,λq 为正实数(或非负实数,后者去除无影响的 λi=0 的项即为前者,故二者等价)且 k=1∑qλk=1;对于严格上凸函数,上述等号成立当且仅当 x1=x2=⋯=xq 。
-
对于下凸函数,f(E[X])≤E[f(x)] 或 k=1∑qλkf(xk)≥f(k=1∑qλkxk) ,其中 λ1,λ2,⋯,λq 为正实数(或非负实数,后者去除无影响的 λi=0 的项即为前者,故二者等价)且 k=1∑qλk=1;对于严格下凸函数,上述等号成立当且仅当 x1=x2=⋯=xq 。
↓ 证明过程如下 ↓
2.1 上凸函数
证明:因为 λi 均为正实数,故有
f(k=1∑qλkxk)=f(λ1x1+k=2∑qλk∑k=2qλk∑k=2qλkxk)≥λ1f(x1)+k=2∑qλk⋅f(∑k=2qλk∑k=2qλkxk)
=λ1f(x1)+k=2∑qλk⋅f(∑k=2qλkλ2x2+∑k=2qλk∑k=3qλk⋅∑k=3qλk∑k=3qλkxk)
≥λ1f(x1)+λ2f(x2)+k=3∑qλk⋅f(∑k=3qλk∑k=3qλkxk)
≥⋯≥k=1∑qλkf(xk)
2.2 严格上凸函数
证明:由定义可知,对于严格上凸函数,f[αx1+(1−α)x2]≥αf(x1)+(1−α)f(x2) 等号成立时当且仅当 x1=x2 。而根据上文对于上凸函数对于 k=1∑qλkf(xk)≤f(k=1∑qλkxk) 不等式推导过程可知,若上凸函数为严格上凸函数,则第一个 ≥ 处等号成立当且仅当:x1=∑k=2qλk∑k=2qλkxk;第二个 ≥ 处等号成立当且仅当:x2=∑k=3qλk∑k=3qλkxk;⋯ ;第 q−1 个 ≥ 处等号成立当且仅当:xq−1=∑k=qqλq∑k=qqλkxk=xq 。所有等号都成立则以上条件都需满足,对以上条件反向推导可得:xq=xq−1;xq−2=∑k=q−1qλk∑k=q−1qλkxk=λq−1+λqλq−1xq−1+λqxq=xq−1;⋯ ;x1=x2 。即
k=1∑qλkf(xk)≤f(k=1∑qλkxk) 等号成立当且仅当 x1=x2=⋯=xq
2.3 下凸函数
证明:因为 λi 均为正实数,故有
f(k=1∑qλkxk)=f(λ1x1+k=2∑qλk∑k=2qλk∑k=2qλkxk)≤λ1f(x1)+k=2∑qλk⋅f(∑k=2qλk∑k=2qλkxk)
=λ1f(x1)+k=2∑qλk⋅f(∑k=2qλkλ2x2+∑k=2qλk∑k=3qλk⋅∑k=3qλk∑k=3qλkxk)
≤λ1f(x1)+λ2f(x2)+k=3∑qλk⋅f(∑k=3qλk∑k=3qλkxk)
≤⋯≤k=1∑qλkf(xk)
2.4 严格下凸函数
证明:由定义可知,对于严格下凸函数,f[αx1+(1−α)x2]≤αf(x1)+(1−α)f(x2) 等号成立时当且仅当 x1=x2 。而根据上文对于下凸函数对于 k=1∑qλkf(xk)≤f(k=1∑qλkxk) 不等式推导过程可知,若下凸函数为严格下凸函数,则第一个 ≤ 处等号成立当且仅当:x1=∑k=2qλk∑k=2qλkxk;第二个 ≤ 处等号成立当且仅当:x2=∑k=3qλk∑k=3qλkxk;⋯ ;第 q−1 个 ≤ 处等号成立当且仅当:xq−1=∑k=qqλq∑k=qqλkxk=xq 。所有等号都成立则以上条件都需满足,对以上条件反向推导可得:xq=xq−1;xq−2=∑k=q−1qλk∑k=q−1qλkxk=λq−1+λqλq−1xq−1+λqxq=xq−1;⋯ ;x1=x2 。即
k=1∑qλkf(xk)≥f(k=1∑qλkxk) 等号成立当且仅当 x1=x2=⋯=xq