UnsplashのBen Hersheyが撮影した写真
帰無仮説とは、統計的な仮説検定で出発点となる仮説で、「差がない」「効果がない」という状態を前提に置くものです。検定では、この前提をデータで棄却できるかどうかを判断します。ここで重要なのは、棄却できなかったからといって「差がないと証明された」とは限らない点です。以下、帰無仮説の定義、検定の流れ、第1種・第2種の過誤、実務での活用場面を順に見ていきます。
帰無仮説とは、統計学における仮説検定で最初に設定される仮説で、「差がない」「効果がない」といった状態を前提とする仮説を指します。観測データがこの仮説と矛盾すると判断できるほど十分に強い場合にのみ、帰無仮説は棄却されます。
帰無仮説は一般に「H0」と表記されます。例えば、「2つの母集団の平均に差がない」「新しい施策は従来手法と比べて効果が変わらない」といった形で設定されます。仮説検定では、帰無仮説が正しいと仮定した場合に、現在のデータがどの程度起こりにくいかを評価します。
帰無仮説に対して設定されるのが対立仮説(H1)です。対立仮説は、「差がある」「効果がある」といった帰無仮説とは反対の内容を表します。検定の結果、帰無仮説が棄却された場合に限り、対立仮説が支持されます。
帰無仮説を用いる理由は、主観的な期待や思い込みを避け、客観的な判断基準を設けるためです。あらかじめ「差がない」状態を仮定し、それをデータによって覆せるかどうかを検証することで、結論の妥当性を評価しやすくなります。
| 分野 | 帰無仮説の例 |
|---|---|
| 医学 | 新薬と既存薬の治療効果に差がない |
| 心理学 | 2つのグループの行動特性に差がない |
| ビジネス | 新UIと旧UIのコンバージョン率に差がない |
これらの例では、帰無仮説を棄却できたときに、「効果がある」「差がある」と判断する流れになります。
帰無仮説の検定は、データから帰無仮説を棄却できるかどうかを判断する手続きです。手順を明確にして進めることで、判断の根拠を追いやすくなります。
これらの手順を通じて、感覚ではなく確率に基づいた判断が行われます。
有意水準とは、帰無仮説が正しいにもかかわらず誤って棄却してしまう確率の上限を示す値です。一般的には5%や1%が用いられます。有意水準を低く設定すると、帰無仮説を棄却する基準は厳しくなり、第1種の過誤は抑えやすくなります。一方で、標本サイズなどの条件が同じなら、第2種の過誤が増えやすくなる点にも注意が必要です。
| 検定方法 | 概要 |
|---|---|
| 片側検定 | 効果の方向が事前に想定されている場合に用いられる |
| 両側検定 | 差の有無のみを検証する場合に用いられる |
検定方法の選択は、分析の目的や前提条件に依存します。
検定統計量は、観測データが帰無仮説からどれだけずれているかを数値で表したものです。t検定やχ二乗検定など、データの種類や比較したい内容に応じて手法を選びます。
仮説検定では、判断の誤りとして第1種の過誤と第2種の過誤が生じる可能性があります。これらを区別して理解することは、検定結果を解釈するうえで重要です。
| 種類 | 内容 |
|---|---|
| 第1種の過誤 | 帰無仮説が正しいのに誤って棄却する |
| 第2種の過誤 | 帰無仮説が誤っているのに棄却できない |
第1種の過誤を抑えようとすると第2種の過誤が増えやすくなり、その逆も成り立ちます。どちらを重視するかは、分野や意思決定の影響度によって変わります。
どちらの過誤を重く見るかは、分野名だけで一律に決まるわけではなく、誤判定がどのような影響を生むかによって変わります。たとえば、人命や安全に直結する場面では第1種の過誤を特に重く見ることがありますが、新機能の改善効果を見逃したくない場面では第2種の過誤への注意が強まることもあります。
A/B テストでは、「新UIと旧UIのコンバージョン率に差がない」「新機能を追加しても主要指標は変わらない」といった形で帰無仮説を設定します。そのうえで、観測データから帰無仮説を棄却できるかどうかを判断し、変更を本番展開するかを検討します。
実務では、有意差が出たかどうかだけでなく、サンプルサイズが十分か、検定方法が目的に合っているか、統計的に有意でも実務上の差として意味があるかまで確認する必要があります。帰無仮説は、結論を機械的に決めるためではなく、どこまでデータで言えるのかを整理するための枠組みとして使うことが重要です。
仮説検定で帰無仮説を棄却できなかった場合でも、それは「差がないことが証明された」という意味ではありません。現在のデータと設定した検定条件では、差があるとまでは言えなかった、という意味です。標本サイズが小さい場合やばらつきが大きい場合は、実際には差があっても検出できないことがあります。
帰無仮説は、「差がない」「効果がない」という状態を出発点とし、データによってそれを覆せるかどうかを検証するための考え方です。有意水準や過誤の概念を理解しておくと、A/Bテストや施策評価でも、結果を早合点せずに判断しやすくなります。
帰無仮説とは、統計的仮説検定で最初に設定される、「差がない」「効果がない」という状態を前提とした仮説です。
主観的な期待や思い込みを避け、データに基づいて客観的に判断するための基準として設定されます。
帰無仮説は差がない前提、対立仮説は差がある前提を示します。検定では、帰無仮説が棄却された場合にのみ対立仮説が支持されます。
いいえ。データが十分でない場合や、統計的に有意と判断できない場合は、帰無仮説は棄却されません。
有意水準とは、帰無仮説が正しいにもかかわらず、誤って棄却してしまう確率の上限を示す値です。
帰無仮説が正しいにもかかわらず、誤って棄却してしまう判断の誤りを指します。
帰無仮説が誤っているにもかかわらず、棄却できない判断の誤りを指します。
A/Bテストや施策効果の比較など、データに基づく意思決定の場面で広く使われています。
観測された差について、設定した有意水準では「差がある」とまでは言えない状態を意味します。差がまったく存在しないと証明されたことを意味するわけではありません。
分析結果を必要以上に言い過ぎることを避けやすくなり、データから何が言えて、何がまだ言えないのかを整理しやすくなります。