今回は、ケンタッキー州にあるマンモス・ケーブ国立公園に行った事からの事例解説です。この国立公園には世界で一番長い洞窟群があり、その洞窟ツアーが今回の目的でした。この国立公園には実に様々な種類の洞窟ツアーがあり、ツアーごとにテーマが異なっていたり、難易度が異なっていたり、歩く長さが異なったりしていました。夏休み期間中のためかどのツアーも満員で予約が必要でした。そのため僕は予め「歴史ツアー」という、約二時間、およそ3キロ程度の距離を歩く洞窟ツアーを予約しておきました。
ツアーの集合場所に10分ほど前に着くと、すでに50人ほどの参加者が集まっていました。どのような人達と一緒に歩くのかと思い、周りをぐるっと眺めてみると、なんだか不思議な感覚に襲われました。
ある人は頭にヘルメット(ヘッドライト付き)を付け、足には登山靴を履き、そして長袖長ズボン、小さなザックも背負っていました。思わず「知らなかった。そんなにも本格的で危険な洞窟だったのか?」と、歩く前から不安に駆られてしまいました。
一方ある人は T シャツに半ズボン、足にはサンダルという、至ってカジュアルな服装でした。逆に、「洞窟の中は寒いと聞いている。そんな恰好で本当に大丈夫か?」と心配してあげたくなりました。僕は長袖ジャケットに、ワークブーツという恰好で参加しました。恐らく、これが普通の、そして平均的な恰好だったと思います。
この服装の違いはどこから来るのでしょうか。僕はリーンシックスシグマの癖なのか、「危険度の認識」と「有意水準 α値」の違いだと、咄嗟に考えてしまいました。それと同時に、「これは統計学の仮説検定で p値や有意水準 α値 を教えるときの、たとえ話として使えるな」と思いました。以下が、そのたとえ話です。
1. 仮説検定:ツアーは安全である
この洞窟ツアーに対して「ツアーは安全である」という帰無仮説を立てます。対立仮説は「ツアーは安全ではない」となり、それを証明すれば、帰無仮説を却下できるわけです。
実際のツアーは舗装された通路が通る巨大な空間(大聖堂)を歩いたり、一方では「みじめな太った男」と呼ばれる幅が狭く、しかも屈まないと通れないようなところを歩いたりしました。安全な所から危険な所まで、実に変化に富んだツアーでした。正規分布を目に浮かべてください。そして分布の右側が危険度の高いところで、左側が危険度の低いところだと思ってください。ツアーの安全度(危険度)の広がりが分かると思います。
登山服の人はかなり安全です。ツアーの安全度分布に従えば、中央よりもかなり右側にあります。帰無仮説が「ツアーは安全である」とすれば、登山服の人の p値は、0.9 かそれ以上です。一方 T シャツの人は絶対に安全とは言えません。T シャツの人の p値は、0.04 かもしれません。
有意水準 α値、つまり「ツアーは実際は安全なのに、安全ではないと判断する確率が」0.1 とすると、登山服の人の p値は有意水準 α値より遥かに大きいので、帰無仮説を否定できません。つまり「ツアーは安全である」と言える十分な証拠があることになります。一方 T シャツの人の p値は有意水準 α値より小さいので、帰無仮設を否定することができます。つまり十分な証拠をもって「ツアーは安全である」とは”言えない”のです。
有意水準 α値は、実際のところツアー参加者の危険度の認識によって変わってきます。あまり危険を顧みない人の α値は非常に小さいでしょう。逆に心配性の人の α値は大きくなります。恐らく Tシャツの人の α値はかなり小さいため、小さな p値をもっても帰無仮説を否定することはできずに、「ツアーは安全である」と判断しての参加だったのではないでしょうか。
2. 仮説検定:ツアーは危険である
帰無仮説を「ツアーは安全である」としたときは、ツアーの安全度分布の左側(安全側)を使って p値を考えましたが、帰無仮説を「ツアーは危険である」とすると、今度はツアーの安全度分布の右側(危険側)を使って p値を考えることになります。つまりこの場合は、登山服の人の p値は 0.1、Tシャツの人の p値は 0.96 となります。
有意水準 α値、つまり「ツアーは実際は危険なのに、危険ではないと判断する確率が」0.1 とすると、登山服の人の p値は有意水準 α値と同じなので、帰無仮説を否定も肯定もできません。きっとその人の判断で有意水準 α値を変えて最終判断とするかもしれません。
一方 T シャツの人の p値は有意水準...