タグ: 検定統計量

  • Z検定とT検定の本質を体系的に理解する

    Z検定とT検定の本質を体系的に理解する

    ✅ はじめに

    統計検定2級の学習において、Z検定とT検定の違いは最重要テーマのひとつです。
    この記事では、**「検定統計量とは何か」**を本質から整理し、Z検定とT検定の違いを体系的にまとめます。


    ✅ 1. 検定統計量とは何か?

    検定統計量とは、簡単にいうと

    「観測されたズレを、ズレが自然に起こる標準的な大きさで割ったもの」

    です。

    式で書くと、一般形はこうなります。

    $$ \text{検定統計量} = \frac{\text{観測された差}}{\text{標準誤差}} $$

    • 観測された差:標本平均 $\overline{X}$ と仮説上の母平均 $\mu$ の差
    • 標準誤差:その差が偶然生じる「標準的な幅」

    ✅ 2. Z検定とは?(母標準偏差が既知の場合)

    ◆ Z検定の検定統計量

    母標準偏差 $\sigma$ が既知の場合、Z検定では以下のように検定統計量 $Z$ を定義します。

    $$ Z = \frac{\overline{X} – \mu}{\frac{\sigma}{\sqrt{n}}} $$

    • 分子:標本平均と母平均の差
    • 分母:標本平均の標準偏差(=母標準偏差を $\sqrt{n}$ で割ったもの)

    ◆ ポイント

    • 元データの標準偏差 $\sigma$ が分かっている前提
    • 標本平均のばらつき(標準誤差)は $\sigma / \sqrt{n}$
    • 使う分布は標準正規分布(Z分布)

    ✅ 3. T検定とは?(母標準偏差が未知の場合)

    ◆ T検定の検定統計量

    母標準偏差 $\sigma$ が未知の場合、標本標準偏差 $S$ を使って検定します。
    このときの検定統計量 $T$ は次のように定義されます。

    $$ T = \frac{\overline{X} – \mu}{\frac{S}{\sqrt{n}}} $$

    • 分子:標本平均と母平均の差
    • 分母:標本標準偏差 $S$ を使った標準誤差

    ◆ ポイント

    • 母標準偏差 $\sigma$ を推定するので不確かさが増える
    • ばらつきが大きくなり、標準正規分布よりも裾の広いt分布を使う
    • t分布の自由度は $n-1$

    ✅ 4. 標本標準偏差と標準誤差の違い

    ここでよく混同しがちな違いを整理します。

    用語 定義 意味
    標本標準偏差 $S$ $S = \sqrt{\frac{1}{n-1} \sum (X_i – \overline{X})^2}$ 元データ $X$ のばらつき
    標準誤差(SE) $\text{SE} = \frac{S}{\sqrt{n}}$ 標本平均 $\overline{X}$ のばらつき

    つまり、
    検定統計量の分母に使うのは、標本平均の標準偏差(標準誤差)
    です!


    ✅ 5. まとめ表

    Z検定 T検定
    母標準偏差 $\sigma$ 既知 未知(推定)
    分母 $\sigma/\sqrt{n}$ $S/\sqrt{n}$
    使用分布 標準正規分布(Z分布) t分布(自由度 $n-1$)
    分散の求め方 母集団の値 標本から計算(2乗和を使う)

    ✅ おわりに

    ここまで整理できれば、Z検定とT検定の違いはほぼ完璧に理解できています。

    • 2標本T検定
    • 分散分析(ANOVA)
    • 回帰分析の検定 などでもこの「ズレ ÷ 標準誤差」という発想がベースになります。