350 g入りと表示されたお菓子の袋の山から,無作為に 100 袋を抽出して重さを調べたところ,平均値が 349.2 g であった。母標準偏差が 4.0 g であるとき,1袋あたりの重さは表示通りでないと判断してよいか。有意水準 5 %で検定せよ。

350 g入りと表示されたお菓子の袋の山から,無作為に 100 袋を抽出して重さを調べたところ,平均値が 349.2 g であった。母標準偏差が 4.0 g であるとき,1袋あたりの重さは表示通りでないと判断してよいか。有意水準 5 %で検定せよ。

1. 検定の準備:仮説を立てる

まず、この問題で私たちが統計的に確かめたいことは何か、そしてその比較対象となる基準は何かを明確に設定します。

  • 証明したいこと(対立仮説 $H_1$): 私たちが「こうではないか?」と主張したい仮説です。今回は「1袋あたりの重さは表示通りではない」ことを確かめたいので、袋全体の本当の平均(母平均 $m$)は $m \ne 350$ g である、と主張します。

  • まず疑うこと(帰無仮説 $H_0$): 上の主張を証明するために、いったん「いや、表示は正しく、重さは表示通りだ」と仮定します。これが帰無仮説で、検定によってこの仮説が間違っている(棄却できる)かどうかを検証します。数式では $m = 350$ g である、と表します。

【このステップのポイント】 実際に測った100袋の平均は349.2gでした。これは表示の350gと確かに違いますが、この-0.8gの差が「たまたま軽い袋を多く引いただけの偶然」なのか、それとも「工場全体で内容量が足りていないという、意味のある違い」なのかを判断するために、まず「もし本当に平均350gだとしたら…」という世界(帰無仮説)を基準に考え始めます。

2. 「もし仮説が正しければ」の世界を考える

次に、「もし帰無仮説が正しい(本当に母平均が350gだ)」としたら、私たちの標本平均 $\bar{X}$(100袋の平均値)はどのような値をとる傾向があるのかを考えます。

標本の大きさ $n=100$ は十分に大きいため、中心極限定理により、標本平均 $\bar{X}$ の分布は、正規分布で近似できることが知られています。

  • 分布の平均: 標本平均の平均は、母平均 $m$ と一致するので 350 g。
  • 分布の標準偏差(標準誤差): 標本平均のバラつきの幅(標準誤差)を計算します。

    暗記標本平均の標準偏差(標準誤差) $$\sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}}$$ (補足:$\sigma$ は母集団全体の標準偏差、 $n$ は標本の大きさ(今回は100袋))

    この公式に当てはめると、 $$\frac{4.0}{\sqrt{100}} = \frac{4.0}{10} = \bf{0.40} \text{ g}$$ となります。

つまり、標本平均 $\bar{X}$ は、平均が350g、標準偏差(標準誤差)が0.40gの正規分布 $N(350, 0.40^2)$ に従うと考えられます。

【このステップのポイント】 計算した「0.40g」という標準誤差は、「もし何度も100袋ずつサンプルを取ってきたら、その平均値はだいたい350gを中心に、プラスマイナス0.40gの幅でばらつくだろう」という「平均値の“よくある”ブレ幅」を示しています。

3. 観測されたデータの「珍しさ」を数値化する (Z値の計算)

この「平均350g、ブレ幅0.40g」を基準として、今回実際に観測された「349.2g」という結果が、どれほど珍しい(平均から離れている)出来事なのかを客観的な指標 Z値 で表します。

暗記Z値の計算式 $$Z = \frac{\bar{X} – m}{\sigma / \sqrt{n}}$$ (補足:$\bar{X}$ は観測した標本平均、 $m$ は帰無仮説の母平均、分母は上で計算した標準誤差)

$$Z = \frac{\bar{X} – 350}{0.40}$$ このZ値は、平均が0、標準偏差が1の標準正規分布 $N(0, 1)$ に従います。

4. 判断基準(棄却域)の設定

どれくらいZ値が0から離れていたら「表示通りではない」と判断するかの基準(ライン)を決めます。今回は「表示通りでないか」を問う両側検定なので、有意水準5%をグラフの両端に2.5%ずつ振り分けます。

正規分布表から、上側2.5%と下側2.5%の境界となるZ値を調べると、それぞれ 1.96-1.96 になります。

したがって、計算したZ値がこの範囲の外、つまり Z ≦ -1.96 または 1.96 ≦ Z であれば、それは「偶然にしては珍しすぎる」と判断し、帰無仮説を棄却します。この範囲を棄却域と呼びます。

5. 最終的な計算と結論

それでは、実際に観測されたデータ $\bar{X}=349.2$ g を使ってZ値を計算し、判定を下します。

$$Z = \frac{349.2 – 350}{0.40} = \frac{-0.8}{0.40} = \bf{-2.0}$$

計算されたZ値は -2.0 でした。 この値と、ステップ4で設定した棄却域(Z ≦ -1.96 または 1.96 ≦ Z)を比較します。

$$-2.0 < -1.96$$

Z値 -2.0 は、棄却域の左側の境界線である-1.96を下回っており、棄却域の中に完全に入っています。 これは、「もし本当に全体の平均が350gだとしたら、100袋の平均が349.2gになるのは、確率5%未満の極めて珍しい出来事である」ということを示しています。

この結果から、検定の出発点であった帰無仮説「$m=350$ である」は、正しくないと判断して棄却します。

【結論】 帰無仮説が棄却されたため、対立仮説「$m \ne 350$ である」を採択する。すなわち、1袋あたりの重さは表示通りでないと判断してよい。

関連記事

「行列」を習った世代と「ベクトル」が数Cに移動した世代、なぜ?~高校数学20年の変遷とその目的~

薬Aの有効率は 0.64 である。薬Bを 100 人の患者に与えたところ, 73人に効果があったという。薬Bの有効率は薬Aより優れていると判断してよいか。有意水準 5%で検定せよ。

1000 g入りと表示された塩の袋の山から,無作為に 100 袋を抽出して重さを調べたところ,平均値が 998.2 g であった。母標準偏差が 5.0 g であるとき,1袋あたりの重さは表示通りでないと判断してよいか。有意水準 5%で検定せよ。

PAGE TOP