ベータ関数

ベータ関数

ベータ関数は次の(広義)積分で定義される。

B(\alpha,\beta)=\int_{0}^{1} t^{\alpha-1} (1-t)^{\beta-1} dt

ここで\alpha,\beta>0としている。ただし、実際は解析接続されて、ガンマ関数による次の表示をもつ:

B(\alpha,\beta)=\frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}

特に、\alpha,\betaが正の整数のときは

B(\alpha,\beta)=\frac{(\alpha-1)! (\beta-1)!}{(\alpha+\beta-1)!}=[(\alpha+\beta-1)\begin{pmatrix}{\alpha+\beta-2}\\{\alpha-1}\end{pmatrix}]^{-1}

と書ける。

不完全ベータ関数

次にベータ関数の一般化として、不完全ベータ関数(incomplete beta function)を次のように定義する:

B(x;\alpha,\beta)=\int_{0}^{x} t^{\alpha-1} (1-t)^{\beta-1} dt

ただし、冪を定義するために[tex:0

正則化されたベータ関数

ここまでの結果は確率の計算に応用される。まずは正則化された不完全ベータ関数(regularized incomplete beta function)を次で定義する:

I_x(\alpha,\beta)=\frac{B(x;\alpha,\beta)}{B(\alpha,\beta)}

以下では\alpha,\betaは正の整数であるとする。上の公式を適用することにより、

I_x(\alpha,\beta+1)-I_x(\alpha+1,\beta)=\begin{pmatrix}{\alpha+\beta}\\{\alpha}\end{pmatrix} x^\alpha (1-x)^\beta

がわかる。従って、

I_x(\alpha,\beta+1)=\sum_{i=\alpha}^{\alpha+\beta}\begin{pmatrix}{\alpha+\beta}\\{i}\end{pmatrix} x^i (1-x)^{\alpha+\beta-i}

を得る。つまり、I_x(\alpha,\beta+1)は例えば表が出る確率がxのコインを\alpha+\beta回投げたときに表が\alpha回以上出る確率に他ならない。この公式は、B(x;\alpha,\beta+1)を普通の多項式積分だと思って直接計算することによっても証明はできると思われるが、計算が大変そうではある。

確率の評価

ここまでの議論により、表が出る確率がpのコインをn回投げてk回以上表が出る確率は、I_p(k,n-k+1)であることがわかった。一方で表が出る期待値はnpである。したがって、k/npよりもそれなりに大きいときは、十分大きいnに対してI_p(k,n-k+1)はほとんど0になるはずである。実際、ヘフディング(Hoeffding)の不等式により、この確率は以下のように上から評価される:

\sum_{i=k}^{n} \begin{pmatrix}{n}\\{k}\end{pmatrix} p^i (1-p)^{n-i} \leq \exp(-2(np-k)^2/n)=\exp(-2n(p-k/n)^2)

この不等式はもう少し一般的な状況でも成立するが、その証明はなかなか見事というか面白い。因みにベータ関数は使わない。

表が出る確率が50%のコインと51%のコインがあったとする。この2つを見分けようとしたときに誤認する確率を考えてみる。実際には50%の方のコインだったとして、それを51%の方だと誤認する確率は、 n 回コインを投げた場合は

[tex:F(n)=I_p*1。例えば n=1000 のときは、505回以上表が出てしまうと誤認してしまうというわけである。いくつかの n に対する F(n) の値をまとめた*2

n F(n)
10^3 0.388
10^4 0.161
10^5 7.91*10^-4
10^6 7.69*10^-24

例えば10万回コインを投げれば誤認する確率は0.08%以下ということになる。 F(n) のグラフを以下に示す。青が F(n) で赤が上で与えた評価(上限)であり、縦軸は対数をとっている。従って上限は傾きが-2(p-k/n)^2=5 \times 10^{-5}の直線となる。見たところ、直線を使う限りにおいては、この評価は最良かそれに近いようである。

参考文献

*1:0.505) \times n,(0.495) \times n+1), \quad \quad \quad p=0.5] で与えられる((端数はあまり気にしないことにする。

*2:計算には Maxima を使った。