次: 凸関数
上: 凸関数と不等式
前: 凸関数と不等式
拓生
『数学対話』の「 相加相乗平均の不等式
」で,次のもっとも基本的な不等式を学びました.
関数 $ f(x) $ が2回微分可能で $ f''(x) < 0 $ を満たしているとする.
また $ n $ は $ n\geqq 2 $ なる自然数とする.
$ p_1+p_2+ \cdots +p_n=1 $ を満たす任意の正の数 $ p_1,\ p_2,\ \cdots,\ p_n $ と,
定義域内の任意の実数 $ x_1,\ x_2,\ \cdots,\ x_n $ に対して,不等式
\[
p_1f(x_1)+p_2f(x_2)+ \cdots +p_nf(x_n)\leqq f(p_1x_1+p_2x_2+ \cdots +p_nx_n)
\]
が成り立ち,等号は $ x_1=x_2=\cdots=x_n $ のときにかぎり,成り立つ.
南海
この不等式は, イェンセンの不等式 と言われ,不等式の基礎になるものだ.
拓生
相加相乗平均の不等式はイェンセンの不等式で,
$ f(x)=\log x $ , $ r_i=\dfrac{1}{n} $ とおくことで得られます.
つまり
\[
\dfrac{1}{n}\log(\alpha_1\alpha_2\cdots\alpha_n)
\leqq \log\left(\dfrac{\alpha_1+\alpha_2+\cdots+\alpha_n}{n}\right)
\]
より得られます.
イェンセンの不等式から,その他のよく知られた不等式も導くことができるのでしょうか.
南海
高校で習う,コーシー・シュワルツの不等式も、三角不等式もここから導くことができる.
拓生
そうなのですか.
ところで, $ f''(x) <0 $ であるとき「その関数のグラフは上に凸である」といいます.
確かにグラフの形はそうなのですが,
では一体「凸」とはどのように定義されるのだろう,など考えました.
南海
関数が凸であることの前提に領域が凸であることがある.
領域が凸であることと,それを用いて関数が凸であることをしっかりと定義し,
領域の凸な性質と関数が凸であることとがどのように結びつくのかを考えよう.
そしていくつかのよく知られた不等式をここから導いてみよう.
そこでまず領域の凸性とは何か,これを明確にしよう.
数学IIIの二次導関数の応用で「上に凸」とか
「下に凸」とか習うわけだが,では「凸」とは何か.
その意味からはっきりさせないと一般化はうまくできなかったわけだ.
ここで二つの多角形を見てほしい.
結論からいうと図1は凸でない五角形だ.それに対して図2は凸な多角形だ.
この違いをどのように定義するのか.
拓生
図を見せてもらったので気づきましたが,凸な方は内部の任意の二点を
結ぶ線分がまた内部にあるが,凸でないと線分が外に飛び出すことがある.
南海
その通り.ここに「凸」をはっきりさせるカギがある.
凸という概念はこのように直線で囲まれた図形だけではなく,
一般の領域で考えられる.領域が凸であることを問題自身のなかで定義した入試問題がある.
例題 [03慶應大]
(1) $ a,\ b,\ c,\ d $ は正数とする.このとき
\[
ab \geqq 1\quad かつ\quad cd \geqq 1
\]
ならば
\[
ad+bc\geqq 2
\]
であることを証明せよ.
(2) 座標平面の部分集合 $ C $ が凸であるとは,
$ C $ の相異なる2点 $ \mathrm{P} $ と $ \mathrm{Q} $ に対して
線分 $ \mathrm{PQ} $ が $ C $ に含まれることである.
\[
D=\{(x,\ y)\ |\ x > 0,\ xy \geqq 1\ \}
\]
が凸であることを証明せよ.
拓生
解いてみます.
問題のなかで定義が与えられているときは,「定義に立ちかえる」が基本です.
問題の定義通りにやってみます.
解答
(1)
\[
a \geqq \dfrac{1}{b}\quad かつ\quad c \geqq \dfrac{1}{d}
\]
であるから
\[
ad+bc\geqq\dfrac{d}{b}+\dfrac{b}{d}\geqq2\sqrt{\dfrac{d}{b}\cdot\dfrac{b}{d}}=2
\]
等号成立は
\[
a=\dfrac{1}{b}=c=\dfrac{1}{d}
\]
のときである.
(2)
集合 $ D $ の2点
$ \mathrm{P}(x_1,\ y_1),\ \mathrm{Q}(x_2,\ y_2) $ をとる.
\[
x_1 > 0,\ x_1y_1\geqq 1,\ x_2 > 0,\ x_2y_2\geqq 1
\]
が成り立っている.
2点を結ぶ線分 $ \mathrm{PQ} $ 上の各点 $ \mathrm{R} $ は
$ 0\leqq t \leqq 1 $ をみたす実数 $ t $ を用いて
\[
\mathrm{R}((1-t)x_1+tx_2,\ (1-t)y_1+ty_2)
\]
と表される.このとき
\begin{eqnarray*}
&&\{(1-t)x_1+tx_2\}\{(1-t)y_1+ty_2\}\\
&=&(1-t)^2x_1y_1+t(1-t)(x_1y_2+x_2y_1)+t^2x_2y_2\\
&\geqq&(1-t)^2+t(1-t)(x_1y_2+x_2y_1)+t^2
\end{eqnarray*}
(1)から
\[
x_1y_2+x_2y_1\geqq 2
\]
が成り立ち,かつ $ t(1-t)\geqq 0 $ であるから
\begin{eqnarray*}
&&\{(1-t)x_1+tx_2\}\{(1-t)y_1+ty_2\}\\
&\geqq&(1-t)^2+2t(1-t)+t^2=\{(1-t)+t\}^2=1
\end{eqnarray*}
つまり点 $ \mathrm{R}((1-t)x_1+tx_2,\ (1-t)y_1+ty_2) $
が再び $ D $ に属することが示された.
つまり線分 $ \mathrm{PQ} $ 上の任意の点が $ D $ に属する.
ゆえに $ D $ は凸であることが証明された.□
南海
この問題にある凸性の定義を改めて書いておこう.
定義(平面領域の凸性)
平面上の領域 $ K $ が凸であるとは,次の命題が成り立つことである.
$ K $ の任意の二点 $ \mathrm{A},\ \mathrm{B} $ に対して,
線分 $ \mathrm{AB} $ 上の点はすべて $ K $ に属する.
このとき領域 $ K $ は凸性をもつともいう.■
拓生
すると定義から,領域 $ K_1,\ K_2 $ が凸なら共通領域 $ K_1\cap K_2 $ も凸です.
点 $ \mathrm{A},\ \mathrm{B}\in K_i $ なら
線分 $ \mathrm{AB} $ 上のすべての点が $ K_i $ に属する,
これが $ i=1,\ 2 $ で成り立つからです.
南海
その通り.これから $ n $ 個の凸領域の共通部分も凸となる.
拓生
$ ax+by\leqq c $ のように直線で座標平面を二つに分けたとき,それぞれの領域は凸です.
定義からすぐに導けます.
南海
やってみてほしい.
拓生
\[
D=\{\ (x,\ y)\ |\ ax+by\leqq c\ \}
\]
とします.集合 $ D $ の2点
$ \mathrm{P}(x_1,\ y_1),\ \mathrm{Q}(x_2,\ y_2) $ をとる.
\[
ax_1+by_1\leqq c,\ ax_2+by_2\leqq c
\]
が成り立っている.2点を結ぶ線分 $ \mathrm{PQ} $ 上の各点 $ \mathrm{R} $ は
$ 0\leqq t \leqq 1 $ をみたす実数 $ t $ を用いて
\[
\mathrm{R}((1-t)x_1+tx_2,\ (1-t)y_1+ty_2)
\]
と表される.このとき
\begin{eqnarray*}
&&a\{(1-t)x_1+tx_2\}+b\{(1-t)y_1+ty_2\}\\
&=&(1-t)(ax_1+by_1)+t(ax_2+by_2)\\
&\leqq&(1-t)c+tc=c
\end{eqnarray*}
よって
点 $ \mathrm{R}((1-t)x_1+tx_2,\ (1-t)y_1+ty_2) $ が再び $ D $ に属する.
ゆえに $ D $ は凸であることが証明された.□
南海
その通り.
拓生
ですからいくつかの半平面の共通領域は多角形をなし,
この多角形は凸性をもちます.これが凸多角形なのですね.
逆に,凸な多角形はこのような半平面の共通部分として得られるのでしょうか.
先ほどの例では,確かに,
図1の多角形は半平面の共通部分としては作れないが,
図2の多角形は半平面の共通部分として作れます.
南海
$ n\ (n \geqq 3) $ についての数学的帰納法でできそうである.
ただ今後の議論には必要ないので,これは宿題としておこう.
そこでまず凸な領域内の $ n $ 個の点とその重みつき平均に関する次の定理を示そう.
定理
凸な平面領域 $ K $ と基準点 $ \mathrm{O} $ がある.
自然数 $ n $ に対し $ K $ の $ n $ 個の点
$ \mathrm{A}_1,\ \mathrm{A}_2,\ \cdots,\ \mathrm{A}_n $ と,
$ 0 < r_1,\ r_2,\ \cdots,\ r_n \quad かつ \quad r_1+r_2+\cdots+r_n=1 $
である $ n $ 個の実数の組をとる.このとき
\[
\overrightarrow{\mathrm{OP}}
=\sum_{k=1}^n r_k\overrightarrow{\mathrm{OA}_k}
\]
で定まる点 $ \mathrm{P} $ は $ K $ に含まれる.■
証明
$ n $ に関する数学的帰納法で証明する.
$ n=1 $ なら明らかである.
$ n $ のときに成立するとし, $ n+1 $ のときの成立を示す.
$ 0 < r_1,\ r_2,\ \cdots,\ r_n,\ r_{n+1} \quad かつ \quad r_1+r_2+\cdots+r_n+r_{n+1}=1 $ である $ n+1 $ 個の実数の組をとり, $ r=r_1+r_2+\cdots+r_n $ とおく. $ r+r_{n+1}=1 $ である.
\begin{eqnarray*}
\overrightarrow{\mathrm{OP}}&=&\sum_{k=1}^{n+1} r_k\overrightarrow{\mathrm{OA}_k}\\
&=&r\sum_{k=1}^n \dfrac{r_k}{r}\overrightarrow{\mathrm{OA}_k}
+r_{n+1}\overrightarrow{\mathrm{OA}_{n+1}}
\end{eqnarray*}
ここで $ \displaystyle \sum_{k=1}^n \dfrac{r_k}{r}=1 $ であるから,
\[
\overrightarrow{\mathrm{OQ}}=
\sum_{k=1}^n \dfrac{r_k}{r}\overrightarrow{\mathrm{OA}_k}
\]
とおくと,数学的帰納法の仮定によって, $ \mathrm{Q}\in K $ である.
そして, $ r+r_{n+1}=1 $ より
\[
\overrightarrow{\mathrm{OP}}
=r\overrightarrow{\mathrm{OQ}}+r_{n+1}\overrightarrow{\mathrm{OA}_{n+1}}
\]
は線分 $ \mathrm{QA}_{n+1} $ 上の点である. $ K $ の凸性によって
$ \mathrm{P}\in K $ である.
$ n+1 $ のときも成立したので,数学的帰納法からすべての自然数 $ n $ で
定理が成立する.□
南海
凸領域の考察を深めるには,
領域が開集合か閉集合か(『解析基礎』参照)等の議論が必要なのだが,
それはここではおいて,
凸領域を不等式等で定義するときは,不等式に等号を入れ境界を含めるようにしよう.
Aozora 2017-09-04