導入
この記事では、統計的推測の基本となる「標本平均」と「標本比率」が、正規分布に近似できることを利用して確率を求める問題について、丁寧に解説していきます。 一見すると複雑な問題ですが、中心となる考え方と公式を理解すれば、スムーズに解くことができます。
(1) 標本平均の確率
問題
母平均 120, 母標準偏差 40 をもつ母集団から、大きさ 100 の無作為標本を抽出するとき、その標本平均 $\bar{X}$ が 124 より大きい値をとる確率を求めよ。
解説
この問題のゴールは、標本平均 $\bar{X}$ がある値より大きくなる確率 $P(\bar{X} > 124)$ を求めることです。
考え方のポイント 標本の大きさ $n$ が大きいとき(一般に30以上)、中心極限定理により、標本平均 $\bar{X}$ の分布は正規分布で近似できることが知られています。 その際、以下の2つの重要な公式を使います。
- 標本平均の期待値: $E(\bar{X}) = \mu$ (標本平均の平均は、母集団の平均(母平均)$\mu$ と等しくなります)
- 標本平均の標準偏差(標準誤差): $\sigma(\bar{X}) = \frac{\sigma}{\sqrt{n}}$ (標本平均のばらつきは、母集団の標準偏差(母標準偏差)$\sigma$ を、標本の大きさ $n$ の平方根で割ったものになります)
ステップ1:標本平均 $\bar{X}$ が従う正規分布を求める まず、$\bar{X}$ がどのような正規分布に従うのかを明らかにします。 問題文から、
- 母平均: $\mu = 120$
- 母標準偏差: $\sigma = 40$
- 標本の大きさ: $n = 100$ です。 標本平均 $\bar{X}$ の標準偏差 $\sigma(\bar{X})$ を計算すると、 $$\sigma(\bar{X}) = \frac{\sigma}{\sqrt{n}} = \frac{40}{\sqrt{100}} = \frac{40}{10} = 4$$ よって、$\bar{X}$ は平均 120, 標準偏差 4 の正規分布 $N(120, 4^2)$ に従うことが分かります。
ステップ2:確率を求めるために変数を標準化する 正規分布の確率を求めるには、標準正規分布表を使えるように、変数を Z値 に変換(標準化)する必要があります。 標準化の公式は次の通りです。 $$Z = \frac{\bar{X} – (\bar{X}の平均)}{(\bar{X}の標準偏差)} = \frac{\bar{X} – \mu}{\sigma/\sqrt{n}}$$これを使って、求めたい確率 $P(\bar{X} > 124)$ をZの式に変換します。$$P(\bar{X} > 124) = P \left( Z > \frac{124 – 120}{4} \right) = P(Z > 1)$$
ステップ3:標準正規分布表を使って確率を計算する $P(Z > 1)$ は、標準正規分布グラフのZ=1より右側の面積を意味します。 全確率の半分である0.5から、$P(0 \le Z \le 1)$ の値を引くことで求められます。 標準正規分布表から、$P(0 \le Z \le 1) \approx 0.3413$ なので、 $$P(Z > 1) = 0.5 – 0.3413 = \bf{0.1587}$$ これが答えとなります。
(2) 標本比率の確率
問題
1個のさいころを 2000 回投げるとき、1の目が出る相対度数を $R$ とする。このとき、確率 $P(|R – \frac{1}{6}| \le \frac{1}{60})$ の値を求めよ。
解説
この問題は、標本における特定の事象の相対度数(標本比率)$R$ が、ある範囲に収まる確率を求めるものです。
考え方のポイント 標本の大きさ $n$ が大きいとき、標本比率 $R$ の分布も正規分布で近似できます。 その際に使う公式は以下の通りです。
- 標本比率の期待値: $E(R) = p$ (標本比率の平均は、母集団におけるその事象の比率(母比率)$p$ と等しくなります)
- 標本比率の標準偏差: $\sigma(R) = \sqrt{\frac{p(1-p)}{n}}$
ステップ1:標本比率 $R$ が従う正規分布を求める まず、母比率 $p$ を考えます。さいころで1の目が出る確率は $\frac{1}{6}$ なので、$p=\frac{1}{6}$ です。 標本の大きさは $n=2000$ です。 標本比率 $R$ の標準偏差 $\sigma(R)$ を計算すると、 $$\sigma(R) = \sqrt{\frac{p(1-p)}{n}} = \sqrt{\frac{\frac{1}{6} \times (1-\frac{1}{6})}{2000}} = \sqrt{\frac{\frac{1}{6} \times \frac{5}{6}}{2000}} = \sqrt{\frac{5}{36 \times 2000}} = \sqrt{\frac{1}{36 \times 400}} = \frac{1}{6 \times 20} = \frac{1}{120}$$ よって、$R$ は平均 $\frac{1}{6}$, 標準偏差 $\frac{1}{120}$ の正規分布 $N(\frac{1}{6}, (\frac{1}{120})^2)$ に従います。
ステップ2:確率を求めるために変数を標準化する (1)と同様に、Z値に変換します。標準化の公式は次の通りです。 $$Z = \frac{R – p}{\sqrt{p(1-p)/n}} = \frac{R – 1/6}{1/120}$$ 求めたい確率は $P(|R – \frac{1}{6}| \le \frac{1}{60})$ です。 この不等式の各辺を、$R$ の標準偏差である $\frac{1}{120}$ で割って、Zの式に変形します。 $$P\left( \frac{|R – \frac{1}{6}|}{1/120} \le \frac{1/60}{1/120} \right)$$ $$= P\left( |Z| \le \frac{1}{60} \times 120 \right) = P(|Z| \le 2)$$
ステップ3:標準正規分布表を使って確率を計算する $P(|Z| \le 2)$ は、$P(-2 \le Z \le 2)$ と同じ意味で、標準正規分布グラフのZ=-2からZ=2までの間の面積を表します。 これは対称性から、$P(0 \le Z \le 2)$ の2倍と等しくなります。 標準正規分布表から、$P(0 \le Z \le 2) \approx 0.4772$ なので、 $$P(|Z| \le 2) = 2 \times P(0 \le Z \le 2) = 2 \times 0.4772 = \bf{0.9544}$$ これが答えとなります。
まとめ
今回の要点を振り返ります。 標本の大きさ $n$ が大きいとき、
- 標本平均 $\bar{X}$ は、平均 $\mu$, 標準偏差 $\frac{\sigma}{\sqrt{n}}$ の正規分布に従う。
- 標本比率 $R$ は、平均 $p$, 標準偏差 $\sqrt{\frac{p(1-p)}{n}}$ の正規分布に従う。
この2つの性質を理解し、標準化の計算に慣れることが、統計的推測の第一歩となります。