一般化平均の証明を丁寧に書いてみる

「平均って何?」と質問されたら、ほぼすべての人は、
「すべての数値を足して、数値の個数で割った値のこと」と答えると思います。
数式で書けば、n個の数値、a_1, a_2, ..., a_nに対して、
\mu=\displaystyle\frac{a_1+a_2+\cdots +a_n}{n}
で定義された値\muを「平均」と呼ぶでしょう。
JIS Z 8101-1:1999では、

2.13(算術)平均,平均値(さんじゅつ)へいきん,へいきんち
arithmetic mean, average
観測値の総和を観測値の個数で割ったもの。

のように定義されています。

様々な平均

実は、JISの表記にもある通り、この平均は「算術平均」とも呼び、また「相加平均」とも呼びます。
何故単純に「平均」(または「平均値」)と呼ばないかと言えば、
この定義以外にも「平均」と名の付くものが存在するからです。

代表的なところでは、

  • 相加平均(算術平均)
  • 相乗平均(幾何平均)
  • 調和平均

の3つでしょうか。
それぞれの定義は、下表のようになります。

名称 定義式
相加平均(算術平均) \mu=\displaystyle\frac{\displaystyle\sum^n_{i=1}x_i}{n}
相乗平均(幾何平均) \mu_G=\sqrt[n]{\displaystyle\prod^n_{i=1}x_i}
調和平均 \mu_H=\displaystyle\frac{n}{\displaystyle\sum^n_{i=1}\frac{1}{x_i}}

※参考ページ:平均 - Wikipedia

一般化平均

実は、平均にはより一般的な定義があり、これを「一般化平均」と呼びます。
一般化平均は、以下の式で定義されます。
\mu_m=\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right\}^\frac1m

一般化平均の定義式について、m=1とすると、
\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^1\right\}^\frac11=\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}=\displaystyle\frac{\displaystyle\sum^n_{i=1}x_i}{n}
となり、これは相加平均となります。

また、m=-1とすると、
\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^{-1}\right\}^\frac1{-1}=\displaystyle\frac{1}{\displaystyle\frac1n\displaystyle\sum^n_{i=1}\frac{1}{x_i}}=\displaystyle\frac{n}{\displaystyle\sum^n_{i=1}\frac{1}{x_i}}
となり、これは調和平均です。

更に、定義上、m=0とすることはできませんが、m\rightarrow0とすると、相乗平均になります。
つまり、
\displaystyle\lim_{m\rightarrow0}\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right\}^\frac1m=\sqrt[n]{\displaystyle\prod^n_{i=1}x_i}
となる…のですが、これだけ見ても「ホント?」と思ってしまうでしょう。
特に、一般化平均には和の記号\sumがあるのに、m\rightarrow0としたら積の記号\prodになるなんて、とても信じられません。

というわけで、本記事では、
\displaystyle\lim_{m\rightarrow0}\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right\}^\frac1m=\sqrt[n]{\displaystyle\prod^n_{i=1}x_i}
となることを、下記Webページを参考に、やや丁寧に証明します。
d.hatena.ne.jp

指数と対数の関係

M=a^{\displaystyle\log_aM}
証明
左辺の\log_aをとると、\log_aM
右辺の\log_aをとると、\log_a{a^{\displaystyle\log_aM}}=\displaystyle\log_aM\cdot\log_aa=\log_aM
よって、(左辺)=(右辺)となるので、M=a^{\displaystyle\log_aM}

ちなみに、f(x)=a^xg(x)=log_a{x}が逆演算であることを考えれば、
a^{\displaystyle\log_aM}=f(g(M))=f\circ g(M)=M
なので、自明という説明もできなくはない。

なお、特にa=eとし、\log_e\lnと表記すれば、M=e^{\displaystyle\ln M}となる。

証明

\displaystyle\lim_{m\rightarrow0}\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right\}^\frac1m=\sqrt[n]{\displaystyle\prod^n_{i=1}x_i}
を証明する。

左辺の極限の中
\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right\}^\frac1m
を変形すると、指数と対数の関係より、
\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right\}^\frac1m
=\left\{e^{\displaystyle\ln{\left(\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right)}}\right\}^\frac1m
=e^{\displaystyle\frac{1}{m}\ln{\left(\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right)}}
となる。
ここで、\ln{\left(\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right)}mに関する関数と考え、f(m)とおくと、
f(m)マクローリン展開が可能である。

f(m)の1回微分は、合成関数の微分法を用いて、
\displaystyle\frac{\mathrm{d}}{\mathrm{d}m}f(m)
=\displaystyle\frac{1}{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m}\cdot\displaystyle\frac1n\displaystyle\sum^n_{i=1}({x_i}^m\cdot\ln{x_i})
=\displaystyle\frac{\displaystyle\sum^n_{i=1}({x_i}^m\cdot\ln{x_i})}{\displaystyle\sum^n_{i=1}{x_i}^m}
となるので、f(m)を1次の項まで展開すると、
\displaystyle\ln{\left(\frac{1}{n}\displaystyle\sum^n_{i=1}{x_i}^m\right)}
=\displaystyle\frac{\displaystyle\ln{\left(\frac{1}{n}\displaystyle\sum^n_{i=1}{x_i}^0\right)}}{0!}+\displaystyle\frac{\displaystyle\frac{\displaystyle\sum^n_{i=1}({x_i}^0\cdot\ln{x_i})}{\displaystyle\sum^n_{i=1}{x_i}^0}}{1!}m+\Omega(m^2)
=0+\displaystyle\frac{\displaystyle\sum^n_{i=1}\ln{x_i}}{n}m+\Omega(m^2)
となる。ここで、\Omega(m^2)は、mに関する次数2以上の多項式であることを意味している。

ゆえに、
\displaystyle\lim_{m\rightarrow0}\left\{\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right\}^\frac1m
=\displaystyle\lim_{m\rightarrow0}e^{\displaystyle\frac{1}{m}\ln{\left(\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right)}}
=\displaystyle\lim_{m\rightarrow0}e^{\left(\displaystyle\frac{\displaystyle\sum^n_{i=1}\ln{x_i}}{n}+\displaystyle\frac{\Omega(m^2)}{m}\right)}
=e^{\displaystyle\frac{\displaystyle\sum^n_{i=1}\ln{x_i}}{n}}
=\sqrt[n]{e^{\displaystyle\sum^n_{i=1}\ln{x_i}}}
=\sqrt[n]{e^{\displaystyle\ln{\displaystyle\prod^n_{i=1}x_i}}}
=\sqrt[n]{\displaystyle\prod^n_{i=1}x_i}
となり、題意は示せた。

マクローリン展開可能であることの証明

ところで、上記証明内で、しれっと「f(m)マクローリン展開が可能であり」なんて書きましたが、
全ての関数がマクローリン展開可能であるわけではないことを考えると、やはり確認しておきたいところです。

マクローリン展開が可能であることの証明は、
テイラーの定理における余剰項においてx=0とした
R_n(x)=\displaystyle\frac{f^{(n)}(0)}{n!}x
n\rightarrow \inftyの時に0に収束することを示せばOKです。

そこで、先ほどのmに関する関数
f(m)=\ln{\left(\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right)}
の余剰項R_n(m)の具体的な式を明らかにすることから始めます。
対数関数\ln{x}n微分
\displaystyle\frac{\mathrm{d}^n}{\mathrm{d}x^n}\ln{x}=\displaystyle\frac{(-1)^{n-1}(n-1)!}{x^n}
となる。
よって、y=\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^mとおけば、
f(m)=\ln{y}となるので、f^{(n)}(m)は、
f^{(n)}(m)
=\displaystyle\frac{\mathrm{d}^n}{\mathrm{d}m^n}\ln{y}
=\displaystyle\frac{\mathrm{d}^n}{\mathrm{d}y^n}\ln{y}\cdot \displaystyle\frac{\mathrm{d}^n y}{\mathrm{d}m^n}
=\displaystyle\frac{(-1)^{n-1}(n-1)!}{y^n}\cdot \displaystyle\frac{1}{n}\sum^n_{i=1}{\left({x_i}^m(\ln{x_i})^n\right)}
=\displaystyle\frac{(-1)^{n-1}(n-1)!}{\left(\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^m\right)^n}\cdot \displaystyle\frac{1}{n}\sum^n_{i=1}{\left({x_i}^m(\ln{x_i})^n\right)}
となる。
従って、m=0とすれば、
f^{(n)}(0)
=\displaystyle\frac{(-1)^{n-1}(n-1)!}{\left(\displaystyle\frac1n\displaystyle\sum^n_{i=1}{x_i}^0\right)^n}\cdot \displaystyle\frac{1}{n}\sum^n_{i=1}{\left({x_i}^0(\ln{x_i})^n\right)}
=\displaystyle\frac{(-1)^{n-1}(n-1)!}{1^n}\cdot \displaystyle\frac{1}{n}\sum^n_{i=1}{\left((\ln{x_i})^n\right)}
=\displaystyle\frac{(-1)^{n-1}(n-1)!}{n}\sum^n_{i=1}{\left((\ln{x_i})^n\right)}
となる。
これを用いて、余剰項R_n(m)
R_n(m)=\displaystyle\frac{f^{(n)}(0)}{n!}m^n
=\displaystyle\frac{(-1)^{n-1}(n-1)!}{n\cdot n!}\sum^n_{i=1}{\left((\ln{x_i})^n\right)}m^n
=\displaystyle\frac{(-1)^{n-1}}{n^2}\sum^n_{i=1}{\left((\ln{x_i})^n\right)}m^n
となる。
よって、\displaystyle\lim_{n\rightarrow \infty}\displaystyle\frac{(-1)^{n-1}}{n^2}=0なので、
余剰項R_n(m)n\rightarrow \inftyの時に0に収束するためには、
\displaystyle\lim_{n\rightarrow \infty}\displaystyle\sum^n_{i=1}{\left((\ln{x_i})^n\right)}
が発散しないことを示せばよい。