1. 検定の準備:仮説を立てる
まず、この問題で私たちが統計的に証明したいことは何か、そしてその比較対象となる基準は何かを明確にします。
-
証明したいこと(対立仮説 $H_1$): 私たちが「こうではないか?」と主張したい仮説です。今回は「薬Bの有効率は、薬Aの0.64よりも優れている」ことなので、薬Bの真の有効率を $p$ とすると、$p > 0.64$ となります。
-
疑っている仮説、否定したい仮説(帰無仮説 $H_0$): 上の主張を証明するために、いったん「いや、薬Bの効果は薬Aと変わらない」と仮定します。これを帰無仮説と呼び、検定によって棄却(否定)することを目指します。数式では $p = 0.64$ と表します。
【ポイント】 統計的検定は、まず「差がない」という帰無仮説を立て、観測されたデータがその仮説のもとで起こるには珍しすぎる(あり得ない)ことを示して、結果的に「やはり差がある(優れている)」という対立仮説を結論づける、という流れを取ります。
2. 「もし仮説が正しければ」の世界を考える
次に、「もし帰無仮説が正しい(薬Bの真の有効率が本当に64%)」としたら、100人に投与した場合、どのような結果が予想されるかを数学的に考えます。
この試行は、「成功確率が0.64の実験を100回繰り返したとき、何回成功するか」と考えることができ、効果があった人の数 $X$ は二項分布 $B(100, 0.64)$ に従います。
この分布の平均的な値(期待値 $m$)と、結果の平均的なバラつきの幅(標準偏差 $\sigma$)を計算します。
-
期待値 $m$ (平均して何人に効くか?) $m = n \times p = 100 \times 0.64 = \bf{64}$ (人) もし本当に有効率が64%なら、平均すると64人に効果が出ると期待できます。
-
標準偏差 $\sigma$ (結果は平均からどのくらいバラつくか?) $\sigma = \sqrt{n \times p \times (1-p)} = \sqrt{100 \times 0.64 \times (1-0.64)} = \sqrt{23.04} = \bf{4.8}$ (人) これは、結果が平均の64人から、だいたいプラスマイナス4.8人くらいの幅でバラつくことを示しています。
3. 観測されたデータの「珍しさ」を数値化する (Z値の計算)
上で計算した「平均64人、バラつきの幅4.8人」を基準として、今回観測された「73人」という結果が、どれほど珍しい(平均から離れている)のかを客観的な指標で表します。この指標が Z値 です。
効果があった人数 $X$ が100と十分に大きいため、正規分布で近似でき、Z値は以下の式で計算します。 $$Z = \frac{X – m}{\sigma} = \frac{X – 64}{4.8}$$ このZ値は、平均が0、標準偏差が1の標準正規分布 $N(0, 1)$ に従います。 式の意味は「(実際の人数)と(平均)の差が、バラつきの幅(標準偏差)の何個分あるか」です。
4. 判断基準(棄却域)の設定
次に、どれくらいZ値が大きければ「それは偶然とは言えない」と判断するかの基準(ライン)を決めます。問題の指示である有意水準5%は、「もし帰無仮説が正しい場合に、その事象が起こる確率が5%未満であれば、偶然ではないと判断する」というルールです。
この「上位5%」に相当するZ値の境界(臨界値)を正規分布表から探します。 正規分布表より、$P(0 \le Z \le 1.64) \approx 0.45$ となっています。これは、グラフの中央(Z=0)からZ=1.64までの面積が45%であることを意味します。 グラフの右半分全体の面積は50%なので、Z=1.64より右側の面積(グラフの端)は、$50\% – 45\% = 5\%$ となります。
したがって、Z値が1.64以上であれば、それは上位5%に入る珍しい結果であると判断できます。この $Z \ge 1.64$ の範囲を棄却域(帰無仮説を棄却するための領域)と呼びます。
5. 最終的な計算と結論
それでは、実際に観測されたデータ $X=73$ を使ってZ値を計算し、判定を下します。
$$Z = \frac{73 – 64}{4.8} = \frac{9}{4.8} = \bf{1.875}$$
計算されたZ値は 1.875 でした。 この値と、ステップ4で設定した棄却域($Z \ge 1.64$)を比較します。
$$1.875 > 1.64$$
計算したZ値は、棄却域の中に完全に入っています。 これは、「もし薬Bの有効率が64%だとしたら、73人も有効な結果が出るのは、確率5%未満の非常に珍しい出来事である」ということを示しています。
この結果から、検定の出発点であった帰無仮説「薬Bの有効率は薬Aと差がない ($p=0.64$)」は、正しくないと判断して棄却します。
【結論】 帰無仮説が棄却されたため、対立仮説「薬Bの有効率は薬Aより優れている」を採択する。したがって、有意水準5%において、薬Bの有効率は薬Aより優れていると判断してよい。