仮説検定:洞窟ツアーと p値

更新日

投稿日

 
  検定
 
 今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公園には世界で一番長い洞窟群があり、その洞窟ツアーが今回の目的でした。この国立公園には実に様々な種類の洞窟ツアーがあり、ツアーごとにテーマが異なっていたり、難易度が異なっていたり、歩く長さが異なったりしていました。夏休み期間中のためかどのツアーも満員で予約が必要でした。そのため僕は予め「歴史ツアー」という、約二時間、およそ3キロ程度の距離を歩く洞窟ツアーを予約しておきました。
 
 ツアーの集合場所に10分ほど前に着くと、すでに50人ほどの参加者が集まっていました。どのような人達と一緒に歩くのかと思い、周りをぐるっと眺めてみると、なんだか不思議な感覚に襲われました。
 
 ある人は頭にヘルメット(ヘッドライト付き)を付け、足には登山靴を履き、そして長袖長ズボン、小さなザックも背負っていました。思わず「知らなかった。そんなにも本格的で危険な洞窟だったのか?」と、歩く前から不安に駆られてしまいました。
 
 一方ある人は T シャツに半ズボン、足にはサンダルという、至ってカジュアルな服装でした。逆に、「洞窟の中は寒いと聞いている。そんな恰好で本当に大丈夫か?」と心配してあげたくなりました。僕は長袖ジャケットに、ワークブーツという恰好で参加しました。恐らく、これが普通の、そして平均的な恰好だったと思います。
 
 この服装の違いはどこから来るのでしょうか。僕はリーンシックスシグマの癖なのか、「危険度の認識」と「有意水準 α値」の違いだと、咄嗟に考えてしまいました。それと同時に、「これは統計学の仮説検定で p値や有意水準 α値 を教えるときの、たとえ話として使えるな」と思いました。以下が、そのたとえ話です。
 

1. 仮説検定:ツアーは安全である

 
 この洞窟ツアーに対して「ツアーは安全である」という帰無仮説を立てます。対立仮説は「ツアーは安全ではない」となり、それを証明すれば、帰無仮説を却下できるわけです。
 
 実際のツアーは舗装された通路が通る巨大な空間(大聖堂)を歩いたり、一方では「みじめな太った男」と呼ばれる幅が狭く、しかも屈まないと通れないようなところを歩いたりしました。安全な所から危険な所まで、実に変化に富んだツアーでした。正規分布を目に浮かべてください。そして分布の右側が危険度の高いところで、左側が危険度の低いところだと思ってください。ツアーの安全度(危険度)の広がりが分かると思います。
 
 登山服の人はかなり安全です。ツアーの安全度分布に従えば、中央よりもかなり右側にあります。帰無仮説が「ツアーは安全である」とすれば、登山服の人の p値は、0.9 かそれ以上です。一方 T シャツの人は絶対に安全とは言えません。T シャツの人の p値は、0.04 かもしれません。
 
 有意水準 α値、つまり「ツアーは実際は安全なのに、安全ではないと判断する確率が」0.1 とすると、登山服の人の p値は有意水準 α値より遥かに大きいので、帰無仮説を否定できません。つまり「ツアーは安全である」と言える十分な証拠があることになります。一方 T シャツの人の p値は有意水準 α値より小さいので、帰無仮設を否定することができます。つまり十分な証拠をもって「ツアーは安全である」とは”言えない”のです。
 
 有意水準 α値は、実際のところツアー参加者の危険度の認識によって変わってきます。あまり危険を顧みない人の α値は非常に小さいでしょう。逆に心配性の人の α値は大きくなります。恐らく Tシャツの人の α値はかなり小さいため、小さな p値をもっても帰無仮説を否定することはできずに、「ツアーは安全である」と判断しての参加だったのではないでしょうか。
 

2. 仮説検定:ツアーは危険である

 
 帰無仮説を「ツアーは安全である」としたときは、ツアーの安全度分布の左側(安全側)を使って p値を考えましたが、帰無仮説を「ツアーは危険である」とすると、今度はツアーの安全度分布の右側(危険側)を使って p値を考えることになります。つまりこの場合は、登山服の人の p値は 0.1、Tシャツの人の p値は 0.96 となります。
 
 有意水準 α値、つまり「ツアーは実際は危険なのに、危険ではないと判断する確率が」0.1 とすると、登山服の人の p値は有意水準 α値と同じなので、帰無仮説を否定も肯定もできません。きっとその人の判断で有意水準 α値を変えて最終判断とするかもしれません。
 
 一方 T シャツの人の p値は有意水準...
 
  検定
 
 今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公園には世界で一番長い洞窟群があり、その洞窟ツアーが今回の目的でした。この国立公園には実に様々な種類の洞窟ツアーがあり、ツアーごとにテーマが異なっていたり、難易度が異なっていたり、歩く長さが異なったりしていました。夏休み期間中のためかどのツアーも満員で予約が必要でした。そのため僕は予め「歴史ツアー」という、約二時間、およそ3キロ程度の距離を歩く洞窟ツアーを予約しておきました。
 
 ツアーの集合場所に10分ほど前に着くと、すでに50人ほどの参加者が集まっていました。どのような人達と一緒に歩くのかと思い、周りをぐるっと眺めてみると、なんだか不思議な感覚に襲われました。
 
 ある人は頭にヘルメット(ヘッドライト付き)を付け、足には登山靴を履き、そして長袖長ズボン、小さなザックも背負っていました。思わず「知らなかった。そんなにも本格的で危険な洞窟だったのか?」と、歩く前から不安に駆られてしまいました。
 
 一方ある人は T シャツに半ズボン、足にはサンダルという、至ってカジュアルな服装でした。逆に、「洞窟の中は寒いと聞いている。そんな恰好で本当に大丈夫か?」と心配してあげたくなりました。僕は長袖ジャケットに、ワークブーツという恰好で参加しました。恐らく、これが普通の、そして平均的な恰好だったと思います。
 
 この服装の違いはどこから来るのでしょうか。僕はリーンシックスシグマの癖なのか、「危険度の認識」と「有意水準 α値」の違いだと、咄嗟に考えてしまいました。それと同時に、「これは統計学の仮説検定で p値や有意水準 α値 を教えるときの、たとえ話として使えるな」と思いました。以下が、そのたとえ話です。
 

1. 仮説検定:ツアーは安全である

 
 この洞窟ツアーに対して「ツアーは安全である」という帰無仮説を立てます。対立仮説は「ツアーは安全ではない」となり、それを証明すれば、帰無仮説を却下できるわけです。
 
 実際のツアーは舗装された通路が通る巨大な空間(大聖堂)を歩いたり、一方では「みじめな太った男」と呼ばれる幅が狭く、しかも屈まないと通れないようなところを歩いたりしました。安全な所から危険な所まで、実に変化に富んだツアーでした。正規分布を目に浮かべてください。そして分布の右側が危険度の高いところで、左側が危険度の低いところだと思ってください。ツアーの安全度(危険度)の広がりが分かると思います。
 
 登山服の人はかなり安全です。ツアーの安全度分布に従えば、中央よりもかなり右側にあります。帰無仮説が「ツアーは安全である」とすれば、登山服の人の p値は、0.9 かそれ以上です。一方 T シャツの人は絶対に安全とは言えません。T シャツの人の p値は、0.04 かもしれません。
 
 有意水準 α値、つまり「ツアーは実際は安全なのに、安全ではないと判断する確率が」0.1 とすると、登山服の人の p値は有意水準 α値より遥かに大きいので、帰無仮説を否定できません。つまり「ツアーは安全である」と言える十分な証拠があることになります。一方 T シャツの人の p値は有意水準 α値より小さいので、帰無仮設を否定することができます。つまり十分な証拠をもって「ツアーは安全である」とは”言えない”のです。
 
 有意水準 α値は、実際のところツアー参加者の危険度の認識によって変わってきます。あまり危険を顧みない人の α値は非常に小さいでしょう。逆に心配性の人の α値は大きくなります。恐らく Tシャツの人の α値はかなり小さいため、小さな p値をもっても帰無仮説を否定することはできずに、「ツアーは安全である」と判断しての参加だったのではないでしょうか。
 

2. 仮説検定:ツアーは危険である

 
 帰無仮説を「ツアーは安全である」としたときは、ツアーの安全度分布の左側(安全側)を使って p値を考えましたが、帰無仮説を「ツアーは危険である」とすると、今度はツアーの安全度分布の右側(危険側)を使って p値を考えることになります。つまりこの場合は、登山服の人の p値は 0.1、Tシャツの人の p値は 0.96 となります。
 
 有意水準 α値、つまり「ツアーは実際は危険なのに、危険ではないと判断する確率が」0.1 とすると、登山服の人の p値は有意水準 α値と同じなので、帰無仮説を否定も肯定もできません。きっとその人の判断で有意水準 α値を変えて最終判断とするかもしれません。
 
 一方 T シャツの人の p値は有意水準 α値より遥かに大きいので、帰無仮設を否定することができません。つまり十分な証拠をもって「ツアーは危険」だと言えることになります。
 

3. 仮説検定:適切な服装である

 
 ちなみにパーク・レンジャーの服装は、サファリ帽子に半そで長ズボンのユニフォーム、ワークブーツを履き、腰にはサーチライトという具合でした。このパーク・レンジャーの服装を基準に、「服装は適切である」という帰無仮説を立てると、登山服の人と Tシャツの人の服装は適切なのか、そうでないのか、ということを検証することができます。言葉で書くとまた長くなるので、これについては皆さんにお任せします。
 

   続きを読むには・・・


この記事の著者

津吉 政広

リーンやシックスシグマ、DFSSなど、問題解決のためのフレームワークを使った新製品の開発や品質の向上、プロセスの改善を得意としています。「ものづくり」に関する問題を一緒に解決してみませんか?

リーンやシックスシグマ、DFSSなど、問題解決のためのフレームワークを使った新製品の開発や品質の向上、プロセスの改善を得意としています。「ものづくり」に関...


「検定・推定」の他のキーワード解説記事

もっと見る
群内誤差と群間誤差  (その1)

 統計学を学ぶ最大の利点の一つは、『効果と誤差』についての理解ができることです。逆に言えば改善アクションを行った時、効果と誤差を区別出来なければ、それが意...

 統計学を学ぶ最大の利点の一つは、『効果と誤差』についての理解ができることです。逆に言えば改善アクションを行った時、効果と誤差を区別出来なければ、それが意...


有意水準、5%の考察

  統計的有意差検定とは一定確率の元で◯×判定を下す手法です。この一定の確率を『有意水準』と呼びます。有意水準とは危険率とも呼ばれ逆に100%から危険率を...

  統計的有意差検定とは一定確率の元で◯×判定を下す手法です。この一定の確率を『有意水準』と呼びます。有意水準とは危険率とも呼ばれ逆に100%から危険率を...


統計的有意差検定とは

1.検定と推定  統計学はデータを数量化して母集団の特徴や傾向を分析したり、母集団からサンプルを抜き取り、この中から母集団の特徴を推測する科学的な学...

1.検定と推定  統計学はデータを数量化して母集団の特徴や傾向を分析したり、母集団からサンプルを抜き取り、この中から母集団の特徴を推測する科学的な学...


「検定・推定」の活用事例

もっと見る
母平均の検定事例(母分散が既知の場合)

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...

 今回は、母集団が正規分布であり、平均値と分散値が既知である場合の検定事例を取り上げます。  小学校4年生のある年の全国身長調査で平均値は143.5cm...