統計学における代表的な検定手法には、Z検定・t検定・χ²(カイ二乗)検定・F検定があります。
それぞれに「想定している分布」と「何を判別するためのものか」という目的があります。
この記事では、数式抜きでざっくりと本質をつかむことを目的に、4つの検定の違いと使い分けを紹介します。
🔵 Z検定:標準正規分布を想定して「平均のズレ」を検証
✅ 想定分布
正規分布(母分散が既知)
✅ 趣旨
理論上の平均と観測された平均が、正規分布の中心からどれくらいズレているかを検定
✅ 主な使いどころ
- 母平均がある値と異なるか(片側/両側検定)
- 2群の平均に差があるか(母分散が既知の場合)
🟢 例:ジュース自販機の平均販売数の検証
あるメーカーが「1日あたり平均100本売れる」と宣言している自販機がある。
10日間の販売データを調べたら平均が105本、母分散は既知であることがわかった。
このとき、販売数が理論値100本から有意にズレているかをZ検定で確認できる。
p値が0.05未満なら「この自販機の販売数は100本とは有意に異なる」と判断する。
🔵 t検定:t分布を想定して「小標本の平均のズレ」を検証
✅ 想定分布
t分布(母分散が未知、小標本)
✅ 趣旨
サンプル数が少ないときに、観測された平均が理論上の平均から有意にズレているかを検定
✅ 主な使いどころ
- 母平均の推定(1標本t検定)
- 2つの平均の差の検定(対応の有無で分岐)
- 母分散が不明な場合
🟢 例:新しい学習アプリの効果検証
ある学習アプリを使った10人の生徒のテスト点数を調べたところ、平均点が75点だった。
従来の平均点は70点で、母分散は不明。
このとき、サンプル数が少なく母分散も不明なのでt検定を使い、
「学習アプリ使用後の平均点が70点と有意に異なるか」を判断できる。
p値が0.05未満なら「アプリ導入で成績が向上した可能性が高い」と結論づけられる。
🔵 χ²(カイ二乗)検定:カイ二乗分布を想定して「分布のズレ・関係の有無」を検証
✅ 想定分布
カイ二乗分布(非負の偏った分布)
✅ 趣旨
観測されたカテゴリーの分布が、理論的な分布と比べてどれくらいズレているかを検定
✅ 主な使いどころ
- 適合度検定:理論分布(例:等確率)とのズレ
- 独立性検定:クロス集計(例:性別×喫煙)の独立性
- 分散分析の前提確認など
🟢 例:スーパーのキャンペーンと購入商品の関係
あるスーパーで「特売チラシを見た人」と「見ていない人」に分けて、牛乳の購入有無を調べたところ下表の結果になった。
牛乳を買った | 買わなかった | 合計 | |
---|---|---|---|
チラシを見た | 45 | 55 | 100 |
見ていない | 30 | 70 | 100 |
期待される分布と比べて、チラシ閲覧と牛乳購入が独立かどうかをχ²検定で確認できる。
p値が0.05未満なら「チラシを見たかどうかは、牛乳購入に関係している」と判断できる。
🔵 F検定:F分布を想定して「分散の違い」を検証
✅ 想定分布
F分布(2つのχ²分布の比)
✅ 趣旨
複数のグループ間で“ばらつき(分散)”に有意な違いがあるかを検定
✅ 主な使いどころ
- 2群の分散の比較(例:製品AとBの品質の安定性)
- 分散分析(ANOVA)の前提検定
🟢 例:学習塾3クラスのテスト点数のばらつき比較
ある学習塾ではA・B・Cの3クラスがあり、それぞれのテスト点数のばらつき(分散)が異なるかを知りたい。
平均点はほぼ同じでも、点数の散らばりが異なると指導法に差がある可能性がある。
F検定では
- 群間のばらつき(クラス間)
- 群内のばらつき(各クラス内)
を比率で評価し、p値が0.05未満なら「少なくとも1クラスは他と分散が異なる」と判断できる。
🧠 まとめ:分布 × 見たいもの
検定名 | 想定分布 | 主な関心 | 主な使い方 |
---|---|---|---|
Z検定 | 正規分布 | 平均のズレ | 母分散既知・大標本 |
t検定 | t分布 | 平均のズレ | 母分散未知・小標本 |
χ²検定 | カイ二乗分布 | 分布のズレ、独立性 | カテゴリデータの分析 |
F検定 | F分布 | 分散の違い | 分散比較・分散分析前提 |
✍ ざっくり一言で言うと…
- Z検定:正規分布で「この平均ズレてる?」を見る
- t検定:少ないデータでも「平均ズレてる?」を見る
- χ²検定:カテゴリごとの「分布ズレてる?」を見る
- F検定:「グループ間でばらつき違いすぎない?」を見る