젠센 부등식

절대부등식 Inequalities
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px; word-break: keep-all"	코시-슈바르츠 부등식	산술·기하 평균 부등식
[math(\left({a_n})({b_n}\right)\ge\left({a_n}{b_n}\right))]	[math(\frac{a_n+b_n}{n}\ge\sqrt[n]{{a_n}{b_n}})]
젠센 부등식	영 부등식
[math(\lambda_n f\left(x_n\right)\ge f\left({\lambda_n}{x_n}\right))]	[math(ab \leq \frac{a^p}{p}+\frac{b^q}{q})]
횔더 부등식	민코프스키 부등식
[math(\\|fg\\|_1\le\\|f\\|_p\\|g\\|_q)]	[math(\\|f+g\\|_p\le\\|f\\|_p+\\|g\\|_p)]
마르코프 부등식	체비쇼프 부등식
[math(\frac{E(X)}k\ge{\rm P}(X\ge k))]	[math(P(\|X-\mu\|<k\sigma)\geq1-\frac1{k^2})]
슈르 부등식
[math(a\left(x-y\right)\left(x-z\right)+b\left(y-z\right)\left(y-x\right)+c\left(z-x\right)\left(z-y\right)\geq0)]
합 기호는 아인슈타인 합 규약을 일부 사용해 단축하였다.		}}}}}}}}}

1. 개요2. 상세3. 증명4. 활용5. 확장6. 관련 문서

1. 개요

Jensens ulighed / Jensen 不等式

덴마크의 수학자 요한 옌센(Johan Jensen)[1]에 의해 발표된 부등식이다. 덴마크인이므로 원어를 존중하자면 J를 반모음 [2]으로 발음하는 '옌센' 부등식이 맞으나 사용빈도가 밀리는 편이고, 영어식으로 J를 자음 [3][4]으로 발음하여 '젠센'[5] 부등식이라 부르는 일이 흔하다.

2. 상세

크게 수학경시 등 고교 과정의 이산적인 버전

함수 [math(f:I\to\R)]이 볼록함수라고 하자. 그러면, 임의의 [math(x_1,x_2,\dots,x_n\in I)]와 [math(\lambda_1+\lambda_2+\cdots+\lambda_n=1)]을 만족하는 임의의 음이 아닌 실수 [math(\lambda_1,\lambda_2,\dots,\lambda_n)]에 대하여 {{{#!wiki style="margin: 10px 0; text-align:center"

[math(\lambda_1 f\left(x_1\right)+\lambda_2 f\left(x_2\right)+\cdots+\lambda_n f\left(x_n\right)\geq f\left(\lambda_1 x_1+\lambda_2 x_2 +\cdots+\lambda_n x_n\right))][6]}}}이다. 만약 [math(f)]가 오목함수이면, 위 부등식의 부호가 반대이다.
또는 확률론 등에서 나오는 일반화된 버전

볼록함수 [math(f)]와 적분가능한 확률 변수 [math(X)]에 대해, [math(\mathbb{E}\left[f(X)\right] \ge f\left(\mathbb{E}[X]\right))]가 성립한다.[7]

이 있다. 볼록함수에 대해서는 문서 참조.[8] 아래의 버전에서 [math(X)]를 [math(P(X=x_i) = \lambda_i)]인 이산확률 변수로 설정하면 위의 버전이 됨을 확인할 수 있다.

한마디로 요약하면 아래로 볼록한 함수에서 함숫값의 산술평균값이 산술평균값의 함숫값보다 크거나 같다는 내용이다.

수학 경시대회의 젠센 부등식은 절대부등식을 증명하는 데에 있어 반드시 알아놔야 할 아주 강력한 부등식으로 평가받는다. 특히 수학 경시대회에서 출제된 부등식 문제가 볼록 (오목) 함수에 관한 것이라 추측이 가능하면 대부분 이 젠센 부등식으로 해결이 가능하다. 합이 주어진 상황에서 함수값의 최적화를 생각하는 사실상의 일반적인 방법으로 생각할 수 있다.

물론 젠센 부등식의 진가는 경시대회에 국한되지 않는다. 마치 벡터만 있으면 나오는 코시-슈바르츠 부등식처럼, 볼록성과 관련된 다방면에 걸친 현상을 설명하는 근본적인 부등식으로 간주되어 확률론, 통계학, 통계 역학, 금융수학, 기대효용이론 등 정말 다양한 분야에서 자연스럽게 등장하곤 한다.

3. 증명

[math(f)]가 두번 미분가능할 때의 증명은 다음과 같다. [math(x_0 = \mathbb{E}[X])]에 대해 볼록함수에 대한 부등식 [math(f(x) \ge f'(x_0)(x-x_0)+f(x_0))]을 생각한다. (증명은 구간 [math([x_0,x])] 또는 [math([x,x_0])]에서 평균값 정리를 쓰면 된다.) 여기서 [math(x=X)]로 놓고 기대값을 취해주면 끝. 미분가능하지 않은 일반적인 볼록함수에 대해서도, 어떤 상수 [math(a)]가 존재해

[math(f(x) \ge a(x-x_0)+f(x_0)\quad\ldots \left(*\right))]

를 만족시킨다는 사실은 변함없기 때문에 그대로 진행하면 된다.

[math(\left(*\right))]의 자세한 증명

[ 펼치기 · 접기 ]: 구간 [math([a,b])]에서의 평균변화율을 [math(df_{p,q} = \dfrac{f(q)-f(p)}{q-p})]라 표기하자. 다음을 먼저 증명한다.
>
[math(p<q<r)]에 대해 [math(df_{p,q} \le df_{p,r} \le df_{q,r})]이다.

이는 볼록함수의 정의로부터 따라나오는 [math((r-p)f(q) \le (r-q)f(p)+(q-p)f(r))]을 변형시켜서

[math((r-p)(f(q)-f(p)) \le (q-p)(f(r)-f(p)),\quad (r-p)(f(q)-f(r)) \le (r-q)(f(p)-f(r)))]

등을 얻어내면 된다. 위의 성질을 이용하면 [math(h_1>h_2>0)]에 대해

[math(df_{x_0-h_1, x} \le df_{x_0-h_2, x} \le df_{x_0,x_0+h_2} \le df_{x_0,x_0+h_1})]

을 알 수 있고, 따라서 좌미분 [math(d_{-}f(x_0) = \displaystyle\liminf_{h \rightarrow 0+}df_{x_0-h,x_0})]와 우미분 [math( d_{+}f(x_0) = \displaystyle\liminf_{h\rightarrow 0+}df_{x_0,x_0+h})]가 존재하고 [math(d_{-}f(x_0) \le d_{+}f(x_0))]임을 알 수 있다. 이제 [math(a)]를 [math(\left[d_{-}f(x_0),d_{+}f(x_0)\right])] 사이의 아무 숫자로 잡으면, [math(x>x_0)]에 대해

[math(f(x)-f(x_0) = df_{x_0,x}(x-x_0) \ge d_{+}f(x_0)(x-x_0) \ge a(x-x_0))]

이고, [math(x<x_0)]에 대해서는

[math(f(x)-f(x_0) = df_{x_0,x}(x-x_0) \ge d_{-}f(x_0)(x-x_0) \ge a(x-x_0))]

이므로 성립한다. [math(\blacksquare)]

경시대회 등에서 이산적인 경우는 보통 수학적 귀납법을 이용해 다음처럼 증명한다.

{{{#!folding [ 증명 펼치기 · 접기 ]
{{{#!wiki style="text-align:left"
[math(n=2)]일 때는 볼록함수의 정의에 의해 성립한다. 이제 [math(n=k)]일 때 성립한다고 가정하자.
[math(\lambda_k>0)]이고 [math(\lambda_1+\lambda_2+\cdots+\lambda_k+\lambda_{k+1}=1)]일 때

[math(\displaystyle\sum_{i=1}^{k+1}\lambda_i f\left(x_i\right)=\left(1-\lambda_{k+1}\right)\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)+\lambda_{k+1}f\left(x_{k+1}\right)\quad\ldots \left(1\right))]

이다. 이 때 [math(\lambda_1+\lambda_2+\cdots+\lambda_k=1-\lambda_{k+1})]이므로 [math(\displaystyle\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}=1)]이다.
[math(n=k)]일 때 성립한다고 가정했으므로 [math(\displaystyle\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}=1)]일 때

[math(\displaystyle\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)\geq f\left(\sum_{i=1}^{k}\frac{\lambda_i x_i}{1-\lambda_{k+1}}\right))]

가 성립한다. 이 식을 [math(\left(1\right))]에 대입하면

<tablealign=center>[math(\begin{aligned}\displaystyle\sum_{i=1}^{k+1}\lambda_i f\left(x_i\right)&=\left(1-\lambda_{k+1}\right)\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)+\lambda_{k+1}f\left(x_{k+1}\right)\\&\geq\left(1-\lambda_{k+1}\right)f\left(\sum_{i=1}^{k}\frac{\lambda_i x_i}{1-\lambda_{k+1}}\right)+\lambda_{k+1}f\left(x_{k+1}\right)\\&\geq f\left(\sum_{i=1}^{k+1}\lambda_i x_i\right)\end{aligned})]

가 성립하게 되어 [math(n=k+1)]일 때도 성립한다. [math(\blacksquare)]}}}}}} ||
함수 [math(f)]가 오목함수일 때도 같은 방법으로 증명이 가능하다. [math(f)]가 오목함수이면 [math(-f)]가 볼록함수이므로 부호만 바꿔주면 된다.

4. 활용

[math(f\left(x\right)=\ln x)], [math(\lambda_i=\frac{1}{n})]라 하자. 로그함수는 오목함수이므로 위 부등식의 방향을 뒤집고 잘 정리해주면 산술·기하 평균 부등식이 튀어나온다! 한 줄짜리 증명이 되어버리는 것.[9] 이 외에도 삼각형의 세 각 [math(\alpha,\beta,\gamma)]에 대해 [math(\sin\alpha+\sin\beta+\sin\gamma\leq\frac{3\sqrt{3}}{2})] 같은 유명한 부등식을 증명하는 데에도 젠센 부등식이 가장 효과적이다.

[math(L^p )] 공간을 연구할 때 쓰이는 횔더 부등식(Hölder-Ungleichung)을 유도할 때 중요하게 쓰이는 부등식이다. 또한 해당 부등식으로부터 민코프스키 부등식(Minkowski-Ungleichung)를 유도하면 해당 공간에 노름을 정의할 수 있다.

여러 응용수학에서도 확률변수와 볼록함수가 같이 튀어나오면 무조건 사용되는 부등식이다. 정보 이론에서 나오는 엔트로피에 대한 Gibbs 부등식 [math( - \sum p_i \log p_i \le - \sum p_i \log q_i )]이나, 통계역학의 여러 상황들이라던지. 금융수학 계열에서도 많이 등장하는데, 보험계리사 보험수리 시험에 나오는 젠센 부등식 (2013년) 이나 FRM: Market Risk management - fixed income 파트에서 젠센 부등식을 채권의 볼록성과 연관지어 학습하게 된다거나(증명과정까지는 요구하지 않지만 기본적인 concept을 이해하고 계산까지 할 줄 알아야 한다.) 등등의 사례가 있다.

5. 확장

개요에서 언급했듯이 젠센 부등식은 산술평균값의 함숫값과 함숫값의 산술평균값을 비교한 부등식이다. 산술평균 대신 다른 평균 (기하평균, 조화평균, 멱평균, 가중치 멱평균)을 넣어도 가능하다. 주의할 점은, 이 때는 함수를 그래프로 나타내었을 때 꼭 아래로 혹은 위로 볼록일 필요는 없다는 것이다.

양의 실수 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]의 [math(r)]차 멱평균을 [math(M_n^r \left\{ x_i \right\})]라고 하자. 즉,

[math(M_n^r \left\{ x_i \right\} = \left\{ \begin{array}{l} \sqrt[r]{\dfrac{x_1^r + x_2^r + \cdots + x_n^r}{n}} & r \neq 0\\ ~ \\ \sqrt[n]{x_1 x_2 \cdots x_n} & r=0\end{array} \right.)]이다.

그리고, 양의 실수 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]의 합이 [math(1)]이고 모두 양수인 가중치 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대한 [math(r)]차 가중치멱평균을 [math(M_n^r \left\{ x_i | \lambda_i \right\})]라고 하자. 즉,

[math(M_n^r\left\{x_i,\lambda_i\right\} = \left\{\begin{array}{l}\sqrt[r]{\lambda_1 x_1^r+\lambda_2 x_2^r+\cdots+\lambda_n x_n^r} & r\ne 0\\~\\ x_1^{\lambda_1}x_2^{\lambda_2}\cdots x_n^{\lambda_n} & r=0\end{array}\right.)]이다.

멱평균으로 일반화한 젠센 부등식은 다음과 같다.

함수 [math(f:I \rightarrow \R)]와 실수 [math(r)]이 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]에 대하여, [math(M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^r \{ x_i \} \right))]이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]에 대하여 [math(M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^r \{ x_i \} \right))]이 성립한다.

그리고 가중치 멱평균으로 일반화한 젠센부등식은 다음과 같다.

함수 [math(f:I \rightarrow \R)]와 실수 [math(r)]이 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]와 임의의 합이 [math(1)]인 양의 실수 [math(\lambda_1)], [math(\lambda_2)]에 대하여, 부등식{{{#!wiki style="text-align:center; margin: 10px 0"

[math(M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^r \{ x_i |\lambda_i \} \right))]}}}이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)], 그리고 합이 [math(1)]인 임의의 양의 실수 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대하여

[math(M_n^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_n^r \{ x_i |\lambda_i \} \right))]

이 성립한다.
하지만, 이게 끝이 아니다! 위 젠센 부등식을 더욱 일반화할 수 있는데, 일반화 내용은 부등식 양변의 멱평균의 차수가 같을 필요가 없다는 것이다. 즉, 멱평균과 가중치 멱평균으로 더욱 일반화된 젠센 부등식은 각각 다음과 같다.

함수 [math(f:I \rightarrow \R)]와 실수 [math(r)], [math(s)]가 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]에 대하여, [math(M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^s \{ x_i \} \right))]이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)]에 대하여 [math(M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^s \{ x_i \} \right))]이 성립한다.

함수 [math(f:I \rightarrow \R)]와 실수 [math(r)], [math(s)]가 주어져 있다. 임의의 [math(x_1)], [math(x_2 \in I)]와 임의의 합이 [math(1)]인 양의 실수 [math(\lambda_1)], [math(\lambda_2)]에 대하여, 부등식{{{#!wiki style="text-align:center; margin: 10px 0"

[math(M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^s \{ x_i |\lambda_i \} \right))]}}}이 성립하면, 임의의 자연수 [math(n)]과 임의의 [math(x_1)], [math(x_2)], [math(\cdots)], [math(x_n)], 그리고 합이 [math(1)]인 임의의 양의 실수 [math(\lambda_1)], [math(\lambda_2)], [math(\cdots)], [math(\lambda_n)]에 대하여

[math(M_n^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_n^s \{ x_i |\lambda_i \} \right))]

이 성립한다.
증명은 멱평균 부등식을 이용할 경우 [math(n)]에 대한 확장된 귀납법 (즉, [math(n)]이 [math(2)]의 거듭제곱일 때 수학적 귀납법으로 증명하고, [math(2)]의 거듭제곱이 아닌 경우를 나중에 증명하는 방법)으로 증명하고, 가중치 멱평균 부등식을 이용할 경우 [math(n)]에 대한 일반적인 수학적 귀납법을 이용하면 된다.

6. 관련 문서

[1] 참고로 옌센의 본업은 수학이 아니었고, 엔지니어였다.[2] IPA로는 경구개 접근음인 [j\]로 표기한다.[3] 이쪽은 유성 후치경 파찰음이며 IPA로는 [d͡ʒ\]로 쓴다.[4] 물론 반모음도 자음이지만 조음 기관의 방해를 받는 정도가 반모음(semiconsonant)보다 진자음(true consonant)이 확실히 높다. 이 문단에서는 앞서 서술한 문장을 적용해, 덴마크어의 J를 반모음으로, 영어의 J를 자음으로 서술하였다. 다만 본문에서는 문서의 주제와 먼 음성학의 복잡한 개념 사용을 회피하고자 간략히 기술하였다.[5] 사실 모음까지 제대로 영어식 발음을 한다면 강세 때문에 '젠슨'이겠지만, 이 부등식 이름의 국문 표기에서만큼은 애매한(?) 영어식이지만 고착화된 '젠센'보다 훨씬 안 쓰인다. 그래서 본문에서는 가장 흔하거나 가장 근본있는 단지 두 경우만 언급하고 있다.[6] n=2라면 볼록함수의 정의가 된다.[7] [math(f(X))]가 적분가능할 필요는 없다. [math(f(X))]의 음수 부분이 적분가능하며, 양수 부분의 적분이 발산하는 경우가 이에 해당한다. 저 부등식은 그대로 성립.[8] 간단히 설명하면, 그래프가 아래로 볼록하게 생긴 함수를 볼록함수라 한다. 즉, 그래프 위의 어느 두 점을 찍더라도 그 점을 이은 선분보다 그래프가 밑에 있다.[9] [math(\lambda_i)]를 임의의 실수라고 두면 가중치가 붙은(weighted) 산술 기하 부등식이 나온다.