黄昏より暗きもの、血の流れより赤きもの

黄昏より暗きもの、血の流れより赤きもの

自分の好きな事を好きなように書いて行きます。

【高校数学B?】確率変数Xが二項分布B(n,p)に従うときの期待値E(X)、分散V(X)の求め方

本記事の想定する読者層

  1. 高校範囲の確率までを勉強し、確率変数の平均や分散までを知っている高校生
  2. 線形代数解析学、確率統計など基礎過程を勉強中の大学生
  3. この他確率統計に興味のある全ての皆様

ベルヌーイ試行と二項分布B(n,p)について

成功と失敗の2種類からなる試行があり、それらの確率をp,1-p(但し0 < p < 1)とする。これを同じ条件かつ独立にn回繰り返す試行の事をベルヌーイ試行*1という。

このとき確率変数X二項分布B(n,p)というものに従う事が知られている。このときP(X=r)において成功がr回、失敗がn-r回あり、何回目に成功と失敗したかの組み合わせが\binom nr*2回ある。以上の事を考慮すると、P(X=r) = \binom nr * p ^ {r} * (1-p) ^ {n-r}*3となる。

二項分布の使いどころとして、ある試行においてその結果が「true or false」「表か裏か?」「白か黒か?」と2値で表されるとき、又は「ある状況にあてはまるとき•当てはまらないとき」の2手に分けて考える時に用いる事ができる。今日はその二項分布における基本的な公式について復習していく。

例題1

1/2の確率で表がでるコインを4回投げる試行を考える。このとき表の出る回数Xの期待値E(X)を求めよ。

解1:各事象が独立な場合を考える

各試行は独立であるため、4回の試行においてE(X) = E(X_1 + X_2 + X_3 + X_4) = 4E(X_1)。ここでE(X_1) =  1 * \frac{1}{2} + 0 * \frac{1}{2} = \frac{1}{2}。以上より、E(X) = 4 * \frac{1}{2} = 2 (答)

解2:確率分布表を作って地道に計算

表の出た回数をr(0≦r≦4)とおく。このときこの試行は重複試行となるため、
P(X=r) = \binom 4r * (\frac{1}{2}) ^ {(4-r)} * (\frac{1}{2}) ^ {r} = \binom 4r * \frac{1}{16} となる。これより確率分布表を作ると、


r 0 1 2 3 4
P(X=r) \frac{1}{16} \frac{4}{16} \frac{6}{16} \frac{4}{16} \frac{1}{16} 1

これより平均E(X) = 0 * \frac{1}{16} + 1 * \frac{4}{16} + 2* \frac{6}{16} + 3* \frac{4}{16} + 4 * \frac{1}{16}= \frac{4}{16} + \frac{12}{16} + \frac{12}{16} + \frac{4}{16} = 2 (答)


解2の補足

解2の確率分布表はB(4,0.5)となっているので、これをグラフにすると以下が得られる。


f:id:program_study:20150320002631p:plain

p=\frac{1}{2}かつ\binom nr = \binom {n}{n-r}が成立し、平均2の回りに同じ分だけ分布している。このように二項分布とは正規分布に近い形状を持っている。ちなみに二項分布B(n,p)においてnを限りなく大きくすると、標準正規分布N(0,1)に近似的に従う性質を持つ。この性質を用いて統計的な検定などを行っていく。

例題2

確率変数Xが二項分布B(n,p)に従うとき、その平均E(X)=np、分散V(X)=np(1-p)で表される事を示せ。

証明*4

二項分布の公式の証明の復習を行う。n回の試行は独立より、平均値E(X_1+X_2+X_3+.....+X_n) = nE(X_i),分散V(X_1+X_2+X_3+.....+X_n) = nV(X_i)を使うと便利。

まずn回の試行は独立であるため、
E(X_1+X_2+X_3+.....+X_n) = nE(X_r)V(X_1+X_2+X_3+.....+X_n) = nV(X_r)。ここでr(0 \leq r \leq n)回目の試行を考え確率分布表を作ると、


X_rの値 0 1
P(X=r) p 1-p 1

これより、
E(X_r) = 1 * p + 0 * (1 - p) =  p
E(X_r^2) = 1^2 * p + 0 * (1 - p) =  p
V(X_r^2) = E(X_r^2) - {E(X)}^2 = p- p^2 = p(1-p)

以上より、E(X) =nE(X_r) = np,V(X) =nE(X_r) = np(1-p) q,e,d

*1:基礎統計学I 統計学入門 東京大学出版会 P111より

*2:TeXを組むのが面倒なので、組み合わせ記号nCrの代わりに、二項係数\binom nrを使って説明。

*3:要は高校数学Iで勉強する重複試行の確率

*4:大学への数学B 研文書院 P219より