next up previous  次: ヘルダーの不等式とコーシー・シュワルツの不等式 上: 凸関数と不等式 前: 凸領域

凸関数

南海   次に凸関数だ. 凸関数とは次のような関数だ.

定義(凸関数)
区間 $ [a,\ b] $ で定義された関数 $ f(x) $ は, 定義域内の相異なる任意の二点 $ x_1,\ x_2 $ に対して, \begin{eqnarray} &(1)\quad つねに f\left(\dfrac{x_1+x_2}{2}\right)\leqq \dfrac{f(x_1)+f(x_2)}{2}\\ または,&(2)\quad つねに \dfrac{f(x_1)+f(x_2)}{2}\leqq f\left(\dfrac{x_1+x_2}{2}\right) \end{eqnarray} が成り立つ.このとき,関数 $ f(x) $ は凸関数であるという.
(1)が成り立つとき下に凸であるといい,
(2)が成り立つとき上に凸であるという.■

符号の正負でわけて,一方を凸関数,他方を凹関数ということもあるが, ここでは上に凸と下に凸を用いる. また,区間 $ [a,\ b] $ で下に凸なら, $ [a,\ b] $ 内の任意の区間 $ [c,\ d] $ でも下に凸であることに注意しよう. これは,定義から明らかである.

定理 関数 $ f(x) $ は区間 $ [a,\ b] $ で連続で,かつ下に凸である. このとき $ 0\leqq t\leqq 1 $ を満たす任意の実数に対して \[ f\left((1-t)a+tb\right)\leqq (1-t)f(a)+tf(b) \] が成り立つ.■

南海   これに関連した過去問題がある.等号の場合であるが, 2008年静岡大学後期 である.それを参考にもして,この定理の証明をやっておきたい.
私の 高校のときのノート が手元にあるが,そこでもこの定理を証明しようとしている. 懐かしいものであるが,実数の連続性を前提としても,二,三厳密でないところがある.また,凸領域の概念もないままであった.
ここで,それらを見直し再構成してゆこう. ただし,以下の議論の土台に実数の連続性があり,その点に関しては『 解析基礎 』の「 実数の構成 」を参考にしてもらいたい.

証明
$ \mathrm{A}(a,\ f(a)) $ , $ \mathrm{B}(b,\ f(b)) $ とする. 区間 $ [a,\ b] $ を $ 2^n $ 等分し,その等分点を \[ p(n,\ j)=a+\dfrac{b-a}{2^n}\cdot j\quad (j=0,\ 1,\ 2,\ \cdots,\ 2^n) \] とおく.また, \[ q(n,\ j)=f(a)+\dfrac{f(b)-f(a)}{2^n}\cdot j\quad (j=0,\ 1,\ 2,\ \cdots,\ 2^n) \] とおく.点 $ (p(n,\ j),\ q(n,\ j)) $ は2点A,Bを結ぶ直線上にある.
任意の $ j\ (j=0,\ 1,\ 2,\ \cdots,\ 2^n) $ に対し \[ f(p(n,\ j))\leqq q(n,\ j)\quad (j=0,\ 1,\ 2,\ \cdots,\ 2^n) \] となることを, $ n $ に関する数学的帰納法で示す.
$ n=1 $ のときは $ j=0,\ 1,\ 2 $ に対して \begin{eqnarray*} &&p(1,\ 0)=a,\ p(1,\ 1)=\dfrac{a+b}{2},\ p(1,\ 2)=b\\ &&q(1,\ 0)=f(a),\ q(1,\ 1)=\dfrac{f(a)+f(b)}{2},\ q(1,\ 2)=f(b) \end{eqnarray*} なので,下に凸の定義から成立する.
$ n=k $ で成立するとする. $ j=0,\ 1,\ 2,\ \cdots,\ 2^k-1 $ に対して \[ f(p(k,\ j))\leqq q(k,\ j),\ \quad f(p(k,\ j+1))\leqq q(k,\ j+1) \] である.これから \[ f\left(\dfrac{p(k,\ j)+p(k,\ j+1)}{2} \right) \leqq \dfrac{f(p(k,\ j))+f(p(k,\ j+1)}{2} \leqq \dfrac{q(k,\ j)+q(k,\ j+1)}{2} \] ところが \begin{eqnarray*} &&\dfrac{p(k,\ j)+p(k,\ j+1)}{2}=\dfrac{1}{2}\left\{a+\dfrac{b-a}{2^k}j+a+\dfrac{b-a}{2^k}(j+1) \right\}\\ &=&a+\dfrac{b-a}{2^{k+1}}(2j+1)=p(k+1,\ 2j+1)\\ &&\dfrac{q(k,\ j)+q(k,\ j+1)}{2} =\dfrac{1}{2}\left\{f(a)+\dfrac{f(b)-f(a)}{2^k}j+a+\dfrac{f(b)-f(a)}{2^k}(j+1) \right\}\\ &=&f(a)+\dfrac{f(b)-f(a)}{2^{k+1}}(2j+1)=q(k+1,\ 2j+1) \end{eqnarray*} であるから \[ f(p(k+1,\ 2j+1))\leqq q(k+1,\ 2j+1) \] である. $ p(k+1,\ 2j+1)=p(k,\ j),\ q(k+1,\ 2j+1)=q(k,\ j) $ だから, あわせて,区間 $ [a,\ b] $ を $ 2^{k+1} $ 等分したときにも, 対応する各等分点において同様の不等式が成り立つ.
よって $ n=k+1 $ でも成立し,各 $ n $ に対し成立する.
次に, $ (1-t)a+tb $ は区間 $ (a,\ b) $ にある. 各 $ n $ に対して \[ p(n,\ j)\leqq (1-t)a+tb < p(n,\ j+1) \] となる $ j $ が存在する.必要なときは,この $ j $ を $ j(n) $ とかく. 実数の連続性によって \[ \lim_{n\to \infty}p(n,\ j(n))=(1-t)a+tb \] であり,そのうえで関数 $ f(x) $ の連続性から \[ \lim_{n\to \infty}f(p(n,\ j(n)))=f((1-t)a+tb) \] である.また3点 \[ (p(n,\ j),\ q(n,\ j)),\ ((1-t)a+tb,\ (1-t)f(a)+tf(b)),\ (p(n,\ j+1),\ q(n,\ j+1)) \] はいずれも直線AB上にある.従って $ (1-t)f(a)+tf(b)) $ は $ q(n,\ j) $ と $ q(n,\ j+1) $ の間にある. よって \[ \lim_{n\to \infty}q(n,\ j(n))=(1-t)f(a)+tf(b) \] も成り立つ.一方, \[ f(p(n,\ j(n)))\leqq q(n,\ j) \] であるので,極限をとって \[ f((1-t)a+tb)\leqq (1-t)f(a)+tf(b) \] が成立する.□

定理  区間 $ [a,\ b] $ で定義された関数 $ f(x) $ が区間 $ (a,\ b) $ で二次導関数が存在するとする.この条件の下で,関数 $ f(x) $ が下に凸であることと $ f''(x)\geqq 0 $ が成り立つことが同値である.そして $ f''(x)=0 $ となる $ x $ は孤立点,つまり十分小さい区間をとれば,そこに単独で存在する.■
証明
下に凸な場合に示す.このとき 定義域内の異なる二点 $ x_1,\ x_2 $ に対して \[ f\left(\dfrac{x_1+x_2}{2}\right)-\dfrac{f(x_1)+f(x_2)}{2} <0 \] である. $ x_1 < x_2 $ とする.この不等式は \[ \dfrac{f\left(\dfrac{x_1+x_2}{2}\right)-f(x_1)}{\dfrac{x_1+x_2}{2}-x_1} < \dfrac{f(x_2)-f\left(\dfrac{x_1+x_2}{2}\right)}{x_2-\dfrac{x_1+x_2}{2}} \] と変形される.
区間 $ [a,\ b] $ を $ 2^n $ 等分し,その等分点を前定理と同様に表す. $ p_{j+1}=\dfrac{p_j+p_{j+2}}{2} $ であるから, 不等式よりただちに \[ \dfrac{f\left(p_{j+1}\right)-f(p_{j})}{p_{j+1}-p_j} < \dfrac{f(p_{j+2})-f\left(p_{j+1}\right)}{p_{j+2}-p_{j+1}} \] が得られる. これから $ i < j $ に関して \[ \dfrac{f\left(p_{i+1}\right)-f(p_{i})}{p_{i+1}-p_i} < \dfrac{f\left(p_{j+1}\right)-f(p_{j})}{p_{j+1}-p_j} \] が成り立つ.
次に区間 $ [a,\ b) $ の任意の $ x $ をとる. \[ p(n,\ j(n))\leqq x < p(n,\ j(n)+1) \] となる $ j(n) $ があり, \[ \lim_{n \to \infty}p(n,\ j(n))= \lim_{n \to \infty}p(n,\ j(n)+1)=x \] である.また区間 $ [p(n,\ j),\ p(n,\ j+1)] $ に平均値の定理を適用することにより, 区間 $ (p(n,\ j),\ p(n,\ j+1)) $ 内の $ c(n,\ j) $ で \[ \dfrac{f\left(p_{j+1}\right)-f(p_{j})}{p_{j+1}-p_j} =f'(c(n,\ j)) \] となるものが存在する.次に $ x < y $ である $ y $ をとる. 同様に \[ \lim_{n \to \infty}p(n,\ k)= \lim_{n \to \infty}p(n,\ k+1)=y \] かつ \[ \dfrac{f\left(p_{k+1}\right)-f(p_{k})}{p_{k+1}-p_k} =f'(c(n,\ k)) \] となる $ k $ および $ c(n,\ k) $ が存在する. $ j < k $ なので \[ f'(c(n,\ j)) < f'(c(n,\ k)) \] であり, \[ p(n,\ j) < x,\ c(n,\ j) < p(n,\ j+1),\ \quad p(n,\ k) < y,\ c(n,\ k) < p(n,\ k+1) \] であるから, $ n\to \infty $ のとき \[ c(n,\ j)\to x,\ c(n,\ k)\to y \] となる.この結果 \[ f'(x)\leqq f'(y) \] が得られる. $ x < y $ のとき $ n $ を大きくとると $ k-j $ は十分大きくなるので 等号は成立しない. したがって $ f'(x) $ は単調増加であり,つねに $ f''(x)\geqq 0 $ が成り立つ. そして $ f''(x)=0 $ となる $ x $ は孤立点である.
逆に, $ f'(x) $ が存在し,かつつねに $ f''(x)\geqq 0 $ が成り立つとする. 定義域内の異なる二点 $ x_1,\ x_2\ (x_1 < x_2) $ をとる. 区間 $ \left[x_1,\ \dfrac{x_1+x_2}{2} \right] $ と 区間 $ \left[\dfrac{x_1+x_2}{2},\ x_2 \right] $ に関して 平均値の定理を適用する. \[ \dfrac{f\left(\dfrac{x_1+x_2}{2}\right)-f(x_1)}{\dfrac{x_1+x_2}{2}-x_1}=f'(c_1),\ \dfrac{f(x_2)-f\left(\dfrac{x_1+x_2}{2}\right)}{x_2-\dfrac{x_1+x_2}{2}}=f'(c_2) \] となる $ c_1,\ c_2 $ がそれぞれ 区間 $ \left(x_1,\ \dfrac{x_1+x_2}{2} \right) $ と 区間 $ \left(\dfrac{x_1+x_2}{2},\ x_2 \right) $ に存在する.
$ f''(x)\geqq 0 $ で $ c_1 < c_2 $ より \[ f'(c_1) < f'(c_2) \] である.つまり \[ \dfrac{f\left(\dfrac{x_1+x_2}{2}\right)-f(x_1)}{\dfrac{x_1+x_2}{2}-x_1} < \dfrac{f(x_2)-f\left(\dfrac{x_1+x_2}{2}\right)}{x_2-\dfrac{x_1+x_2}{2}} \] である.これを整理して \[ f\left(\dfrac{x_1+x_2}{2}\right) < \dfrac{f(x_1)+f(x_2)}{2} \] を得る.つまり関数 $ f(x) $ は下に凸である.□
南海   上に凸な場合も証明は同様である.

次の定理が,関数の凸性と領域の凸性を結びつける.

定理

関数 $ f(x) $ は定義域 $ [a,\ b] $ で連続で,下に凸であるとする. このとき領域 \[ K=\{\ (x,\ y)\ | \ f(x)\leqq y,\ a \leqq x \leqq b \ \} \] は凸性をもつ.■

証明
$ K $ から二点 $ \mathrm{P}(p_1,\ p_2),\ \mathrm{Q}(q_1,\ q_2)\ (p_1\leqq q_1) $ をとる. 条件から \[ a\leqq p_1,\ q_1\leqq b,\ f(p_1)\leqq p_2 ,\ f(q_1)\leqq q_2 \] である.線分 $ \mathrm{PQ} $ 上の点 $ \mathrm{C} $ を $ 0 < t < 1 $ なる $ t $ を用いて \[ \mathrm{C}\left((1-t)p_1+tq_1,\ (1-t)p_2+tq_2 \right) \] とおく.点 $ \mathrm{C} $ が $ K $ に属することを示せばよい. つまり, \[ f((1-t)p_1+tq_1)\leqq (1-t)p_2+tq_2 \] を示せばよい.
定理を区間 $ [p_1,\ q_1] $ で用いることにより \[ f((1-t)p_1+tq_1)\leqq (1-t)f(p_1)+tf(q_1) \] なので,条件とあわせて \[ f((1-t)p_1+tq_1)\leqq (1-t)p_2+tq_2 \] が成り立つ.よって領域 $ K $ は凸である.□


南海   ここで点 $ \mathrm{C} $ が $ K $ の境界 $ y=f(x) $ 上にあるのは, 二点 $ \mathrm{P},\ \mathrm{Q} $ が同一の点でかつ $ y=f(x) $ 上にあるときにかぎることを確認しよう.
また,関数が上に凸で連続なときは不等号を逆にすることで, 同様に領域 $ y\leqq f(x) $ の凸性が示される.
定理(凸領域)と定理(凸関数)を結びつけると次のことが成立する.


関数 $ f(x) $ は定義域で連続で,下に凸である. このとき,定義域の $ n $ 個の $ x $ の値 $ \alpha_1,\ \alpha_2,\ \cdots,\ \alpha_n $ と $ 0 < r_1,\ r_2,\ \cdots,\ r_n \quad かつ \quad r_1+r_2+\cdots+r_n=1 $ である $ n $ 個の実数の組に対して不等式 \[ f \left(r_1\alpha_1+r_2\alpha_2+\cdots+r_n\alpha_n\right) \leqq r_1f(\alpha_1)+r_2f(\alpha_2)+\cdots+r_nf(\alpha_n) \ \] が成立する. ここで等号が成立するのは $ i=1,\ 2,\ \cdots,\ n $ に対する $ \alpha_i $ がすべて等しいときであり,そのときにかぎる.■

証明   $ n $ 個の点 $ \left(\alpha_i,\ f(\alpha_i) \right)\ (i=1,\ 2,\ \cdots,\ n) $ は領域 $ f(x)\leqq y $ に属する.定理(凸関数)によってこの領域は凸なので, 定理(凸領域)から点 \[ \left(r_1\alpha_1+r_2\alpha_2+\cdots+r_n\alpha_n,\ f \left(r_1\alpha_1+r_2\alpha_2+\cdots+r_n\alpha_n\right) \right) \] も領域 $ f(x)\leqq y $ に含まれる.よって 不等式が成立する.
等号成立条件を数学的帰納法で示す. $ n=1 $ のときは成立.
$ n $ のとき成立するとする.
$ n+1 $ のとき等号が成立する条件は 定理の証明において,点 $ \mathrm{Q} $ が $ y=f(x) $ 上にあり, かつ \[ \overrightarrow{\mathrm{OP}} =r\overrightarrow{\mathrm{OQ}}+r_{n+1}\overrightarrow{\mathrm{OA}_{n+1}} \] で定まる点 $ \mathrm{P} $ も $ y=f(x) $ 上にあることである.
帰納法の仮定から $ \alpha_i\ (i=1,\ 2,\ \cdots,\ n) $ がすべて等しく,かつ定理(凸関数)の証明において \[ (1-t)f(p_1)+tf(q_1) =f((1-t)p_1+tq_1) \] となるときである.それが $ p_1=q_1 $ となるときにかぎることは, 証明のなかにある. よって $ n+1 $ このときに等号が成立するのは $ \alpha_{n+1} $ が他の $ \alpha_i $ に等しいときであり, このときにかぎる.つまり $ \alpha_i\ (i=1,\ 2,\ \cdots,\ n,\ n+1) $ すべて等しいときである. よって系が示された.□

拓生   これは「相加相乗平均の不等式」にあるイェンセンの不等式の凸関数を用いた証明の別証明ですか.
南海   中味は同じこと,つまり凸関数で定まる領域の凸性を用いているので, 別証明とはいえない. しかし,領域の凸性と関数の凸性をいったん別個に定義し, それを結びつけたので論証の仕組みが見やすい.
『不等式』(Hardy)には「凸関数の理論における基礎はイェンセンによって構築された」とある. イェンセン(Jensen)の論文は,「Sur les fonction convexes et les in\'egalit\'es entre les valeurs moyennes,\ Acta Math.30(1906),\ 175-193」とのことである.
拓生   凸関数のグラフ上に,順に $ n\ \ (n \geqq 3) $ 個の値 \[ x_1 < x_2 < \cdots < x_n \] を取り,これに対する $ xy $ 平面上の $ n $ 個の点 \[ \mathrm{A}_1(x_1,\ f(x_1)),\ \mathrm{A}_2(x_2,\ f(x_2)),\ \cdots,\ \mathrm{A}_n(x_n,\ f(x_n)) \] で定まる多角形 $ \mathrm{A_1A_2\cdots A}_n $ とは凸多角形になります. つまり多角形の周と内部でできる領域 $ P $ は凸性をもちます.
南海   どうして言えるのか.
拓生   下に凸なときに考えます. $ x $ の値が $ f(x) $ の定義区間内でかつ $ y\geqq f(x) $ である領域 $ K $ は凸性をもちます. したがって多角形の各辺は $ K $ に属し,その結果 $ P $ そのものも $ K $ に属します.
直線 $ \mathrm{A}_i\mathrm{A}_{i+1} $ で $ K $ を二つの領域に分けます. このとき,領域 $ P $ は二つに分けられた $ K $ の各領域のいずれか一方にのみ属します. もしそうでないと, $ x_i $ と $ x_{i+1} $ の間にもう一つ頂点を作る $ x $ の値が必要になります.また,直線 $ \mathrm{A}_n\mathrm{A}_1 $ に関しても領域 $ P $ は二つに分けられた $ K $ の各領域のいずれか一方にのみ属します.
したがって $ P $ は, これら各辺をつくる直線で平面を二つに分け $ P $ の属する側を取るとき, その共通部分になります.
そこで, $ P $ 内の2点 $ \mathrm{S},\ \mathrm{T} $ をとります. 直線 $ \mathrm{A}_i\mathrm{A}_{i+1} $ で分けられる $ K $ の二つの領域はともに凸性をもちます.ですから,線分 $ \mathrm{ST} $ はこの $ K $ の二つの領域のうち, $ P $ のある側に属します.
これが各辺について言えるので, 線分 $ \mathrm{ST} $ はそれらの共通部分である $ P $ に属します. つまり $ P $ は凸な領域です.

Aozora 2017-09-04