41.サイコロと統計
サイコロを100回振って同じ目が30回出たら「おかしい」と感じますが、統計ではどう解釈しているのでしょうか。1から6までの目の出る確率は1/6ですから、100回振ったときのそれぞれの目の出る回数は17回程度です。ですから、30回も同じ目が出ることはめったにありません。これを統計で計算すると、30回同じ目が出る確率は0.5%以下です。逆に言えば、100回サイコロを振る実験を200回繰り返すと、1回はそのような場合があり得ます。
42.プロ野球のボールと確率
プロ野球のボールが、飛ぶ仕様に変えられていたことが話題になりました。数十試合経過した段階でのホームラン数の多さは、ボールなどの条件が変わっていない限り、統計的には発生確率が1%なのだそうです(NHK「クローズアップ現代」より)。ただ、逆に言えば100年に一度はあり得るということにもなります。
43.統計は「絶対」とは言ってくれない
サイコロを100回振って、同じ目が30回以上出る確率は0.5%以下でした。野球のボールが変わっていないのに、多くの本塁打が出る確率は1%でした。ところが、「絶対にサイコロやボールがおかしい」と言い切れる確率は、データを増やしてもどうしても100%にはなりません。それが統計のはじき出す回答です。「あり得る確率は*%以下」が示されるだけです。つまり数理的な参考値にはなりますが、最後の決断は人間に任されます。 では、統計の値がどうであれば人は「こう決断しよう」ということになるのでしょうか。あり得る確率が1%以下なら、決断できるのでしょうか。それはいろいろな前提により異なるでしょう。 友達どうしのゲームで使うサイコロなら、「もう100回振ってみて、同じようならそのサイコロを使うのはやめよう」となります。 しかし、「間違えたら罰金1000万円です」という立場に追い込まれたなら、言い切れる確率がもっと十分な値に近づく方法を探すことになるでしょう。
44.M距離の統計的な意味
以前「M距離は4以下であれば、ほぼ元のパターンの仲間」と書きましたが、それは「4を超えたら元のパターンの仲間とは言わないことにしよう」ということです。仲間と言える確率が小さいからです。 「統計は数値(確率)を提示し、それをどう扱うかは最終的には人間の決断」なのですが、その事情はM距離も同じです。サイコロと同じようにM距離の信頼度を確率で論じることができます。 M距離は1とか2であれば、「仲間とは言えない確率」が小さく、4,5…と大きくなると確率が大きくなります。ですから、どこかで境界の値(しきい値)を設けます。この境界を決めるのが人なのです。その境界の値もサイコロのときと同じ...
45.統計の嘘にも気を付けよう
「統計は最強」は統計学者の方々が主張したいことですが、「統計の嘘」ということもいろいろな方々から言われます。ちょっとヘンだな、という事例をいくつかご紹介します。
①日本の家庭の平均貯蓄額は1300万円
②ウィスキーに水を混ぜて飲むと酔います。焼酎にお湯を混ぜて飲むと酔います。したがって、共通している液体である水を飲むと酔います。
③日本人が好きなある食料を食べる人の40%は癌になります