首都圏模試センターの試験データを分析することで、問題の難易度と生徒の偏差値の関係性を精緻にモデル化することができました。ここではその結果を紹介します。
✅ 1. 問題の偏差値とは?
ある問題について、全体の正答率が $p$ のとき、次の式でその問題を50%の確率で解ける生徒の偏差値(=問題の偏差値)を算出できます。
$$\boxed{問題偏差値 = 17 \cdot NORM.S.INV(1-p) + 50}$$
- $NORM.S.INV(1-p)$:標準正規分布の逆関数
- $17$:偏差値の標準偏差
- $50$:偏差値の基準値
📌 具体例
全体正答率 | 問題偏差値 |
---|---|
70% | 40 |
50% | 50 |
30% | 60 |
このように、正答率が低い問題ほど偏差値が高いことがわかります。
✅ 2. 生徒偏差値と問題偏差値から正答率を予測
さらに、生徒の偏差値と問題偏差値を使ってその生徒が問題を解ける確率は次の式で表せます。
$$\boxed{正答率 = \frac{1}{1 + e^{-(生徒偏差値 – 問題偏差値)\cdot 0.15}}}$$
これはアイテム反応理論(IRT)のロジスティックモデルを偏差値ベースに置き換えたものです。
- 生徒偏差値 = 問題偏差値 → 正答率50%
- 生徒偏差値が問題偏差値より高い → 正答率50%以上
- 生徒偏差値が問題偏差値より低い → 正答率50%未満
📊 決定係数 $R^2 = 0.995$
このモデルを首都圏模試の実測データに当てはめたところ、決定係数 $R^2$ は0.995という非常に高い精度を示しました。
つまり、このシンプルなモデルで模試結果のほぼ全てを説明できることがわかりました。
✅ 3. 各社模試の偏差値換算式
各模試は母集団や分布が異なるため、同じ「偏差値○○」でも意味が違います。これを四谷大塚偏差値(Y偏差値)を基準に次の式で換算できます。
模試 | 換算式 |
---|---|
SAPIX (S偏差値) | $S偏差値 = Y偏差値 \times 1.08 – 14$ |
日能研 (N偏差値) | $N偏差値 = Y偏差値 \times 1.025 – 3.2$ |
首都圏模試 (都偏差値) | $都偏差値 = Y偏差値 \times 0.89 + 15$ |
📌 具体例
Y偏差値 | S偏差値 | N偏差値 | 都偏差値 |
---|---|---|---|
50 | 40.0 | 47.1 | 59.5 |
60 | 50.8 | 56.3 | 68.4 |
70 | 61.6 | 65.6 | 77.3 |
- SAPIXは上位層が厚いため高偏差値が取りにくい。
- 首都圏模試は母集団が広く、偏差値が高めに出やすい。
✅ 4. まとめ
- 問題の偏差値と生徒の偏差値の差から正答率を予測できるシンプルなモデルができた。
- 決定係数0.995という高精度で模試データを説明可能。
- 各模試偏差値の換算式を使えば、模試間の比較が容易になる。
これらの分析は、受験指導や模試結果の活用において大きな武器になります。