MTシステム超入門(その11)

投稿日

41.サイコロと統計

 サイコロを100回振って同じ目が30回出たら「おかしい」と感じますが、統計ではどう解釈しているのでしょうか。1から6までの目の出る確率は1/6ですから、100回振ったときのそれぞれの目の出る回数は17回程度です。ですから、30回も同じ目が出ることはめったにありません。これを統計で計算すると、30回同じ目が出る確率は0.5%以下です。逆に言えば、100回サイコロを振る実験を200回繰り返すと、1回はそのような場合があり得ます。

 

42.プロ野球のボールと確率

 プロ野球のボールが、飛ぶ仕様に変えられていたことが話題になりました。数十試合経過した段階でのホームラン数の多さは、ボールなどの条件が変わっていない限り、統計的には発生確率が1%なのだそうです(NHK「クローズアップ現代」より)。ただ、逆に言えば100年に一度はあり得るということにもなります。

 

43.統計は「絶対」とは言ってくれない

 サイコロを100回振って、同じ目が30回以上出る確率は0.5%以下でした。野球のボールが変わっていないのに、多くの本塁打が出る確率は1%でした。ところが、「絶対にサイコロやボールがおかしい」と言い切れる確率は、データを増やしてもどうしても100%にはなりません。それが統計のはじき出す回答です。「あり得る確率は*%以下」が示されるだけです。つまり数理的な参考値にはなりますが、最後の決断は人間に任されます。  では、統計の値がどうであれば人は「こう決断しよう」ということになるのでしょうか。あり得る確率が1%以下なら、決断できるのでしょうか。それはいろいろな前提により異なるでしょう。  友達どうしのゲームで使うサイコロなら、「もう100回振ってみて、同じようならそのサイコロを使うのはやめよう」となります。 しかし、「間違えたら罰金1000万円です」という立場に追い込まれたなら、言い切れる確率がもっと十分な値に近づく方法を探すことになるでしょう。

 

44.M距離の統計的な意味

 以前「M距離は4以下であれば、ほぼ元のパターンの仲間」と書きましたが、それは「4を超えたら元のパターンの仲間とは言わないことにしよう」ということです。仲間と言える確率が小さいからです。  「統計は数値(確率)を提示し、それをどう扱うかは最終的には人間の決断」なのですが、その事情はM距離も同じです。サイコロと同じようにM距離の信頼度を確率で論じることができます。  M距離は1とか2であれば、「仲間とは言えない確率」が小さく、4,5…と大きくなると確率が大きくなります。ですから、どこかで境界の値(しきい値)を設けます。この境界を決めるのが人なのです。その境界の値もサイコロのときと同じ...

41.サイコロと統計

 サイコロを100回振って同じ目が30回出たら「おかしい」と感じますが、統計ではどう解釈しているのでしょうか。1から6までの目の出る確率は1/6ですから、100回振ったときのそれぞれの目の出る回数は17回程度です。ですから、30回も同じ目が出ることはめったにありません。これを統計で計算すると、30回同じ目が出る確率は0.5%以下です。逆に言えば、100回サイコロを振る実験を200回繰り返すと、1回はそのような場合があり得ます。

 

42.プロ野球のボールと確率

 プロ野球のボールが、飛ぶ仕様に変えられていたことが話題になりました。数十試合経過した段階でのホームラン数の多さは、ボールなどの条件が変わっていない限り、統計的には発生確率が1%なのだそうです(NHK「クローズアップ現代」より)。ただ、逆に言えば100年に一度はあり得るということにもなります。

 

43.統計は「絶対」とは言ってくれない

 サイコロを100回振って、同じ目が30回以上出る確率は0.5%以下でした。野球のボールが変わっていないのに、多くの本塁打が出る確率は1%でした。ところが、「絶対にサイコロやボールがおかしい」と言い切れる確率は、データを増やしてもどうしても100%にはなりません。それが統計のはじき出す回答です。「あり得る確率は*%以下」が示されるだけです。つまり数理的な参考値にはなりますが、最後の決断は人間に任されます。  では、統計の値がどうであれば人は「こう決断しよう」ということになるのでしょうか。あり得る確率が1%以下なら、決断できるのでしょうか。それはいろいろな前提により異なるでしょう。  友達どうしのゲームで使うサイコロなら、「もう100回振ってみて、同じようならそのサイコロを使うのはやめよう」となります。 しかし、「間違えたら罰金1000万円です」という立場に追い込まれたなら、言い切れる確率がもっと十分な値に近づく方法を探すことになるでしょう。

 

44.M距離の統計的な意味

 以前「M距離は4以下であれば、ほぼ元のパターンの仲間」と書きましたが、それは「4を超えたら元のパターンの仲間とは言わないことにしよう」ということです。仲間と言える確率が小さいからです。  「統計は数値(確率)を提示し、それをどう扱うかは最終的には人間の決断」なのですが、その事情はM距離も同じです。サイコロと同じようにM距離の信頼度を確率で論じることができます。  M距離は1とか2であれば、「仲間とは言えない確率」が小さく、4,5…と大きくなると確率が大きくなります。ですから、どこかで境界の値(しきい値)を設けます。この境界を決めるのが人なのです。その境界の値もサイコロのときと同じで、間違えたときの損失を考えながら決めることになります。5と書いたのに5と読まなかった損失と、6と書いたのに5と読んでしまった損失の両方があります。

 

45.統計の嘘にも気を付けよう

 「統計は最強」は統計学者の方々が主張したいことですが、「統計の嘘」ということもいろいろな方々から言われます。ちょっとヘンだな、という事例をいくつかご紹介します。

①日本の家庭の平均貯蓄額は1300万円

②ウィスキーに水を混ぜて飲むと酔います。焼酎にお湯を混ぜて飲むと酔います。したがって、共通している液体である水を飲むと酔います。

③日本人が好きなある食料を食べる人の40%は癌になります

   続きを読むには・・・


この記事の著者

手島 昌一

データ解析やパターン認識をしてみたいけれど難しそう、と考えていませんか? MTシステムは“分かった”,“使える”への最適解です。

データ解析やパターン認識をしてみたいけれど難しそう、と考えていませんか? MTシステムは“分かった”,“使える”への最適解です。


「MTシステム」の他のキーワード解説記事

もっと見る
MTシステム超入門(その22)

 日経新聞2013年12月の「私の履歴書」は、米国のフィリップ・コトラー博士の連載でした。博士は“マーケティング”の専門家として著名ですが、初期のころは経...

 日経新聞2013年12月の「私の履歴書」は、米国のフィリップ・コトラー博士の連載でした。博士は“マーケティング”の専門家として著名ですが、初期のころは経...


MTシステム超入門(その15)

57.MTシステムのソフト  Microsoft Excel上でMTシステムの操作ができる市販のソフトウェアがあります。筆者のアングルトライ社からも製品...

57.MTシステムのソフト  Microsoft Excel上でMTシステムの操作ができる市販のソフトウェアがあります。筆者のアングルトライ社からも製品...


MTシステム超入門(その20)

1.品質の数値化は裏から見る  「品質」の価値はどうやって数値化したらよいのでしょう?  期待した品質分が上乗せされていても購入を決断する金額、その上...

1.品質の数値化は裏から見る  「品質」の価値はどうやって数値化したらよいのでしょう?  期待した品質分が上乗せされていても購入を決断する金額、その上...


「MTシステム」の活用事例

もっと見る
MT(マハラノビスタグチ)法などのAI手法を活用した故障予測

◆ MT法などを活用した故障予測 (1)洗濯機のモータ 工程や製造装置ではMT(マハラノビスタグチ)法などのAI手法を活用した故障予測が一般的にな...

◆ MT法などを活用した故障予測 (1)洗濯機のモータ 工程や製造装置ではMT(マハラノビスタグチ)法などのAI手法を活用した故障予測が一般的にな...


イプシロンロケットとMTシステム

1.イプシロンロケット打上げ成功とMTシステム  先月9月14日午後2時に、JAXAのイプシロンロケットが無事打上げに成功しました。成否を左右する「ロケ...

1.イプシロンロケット打上げ成功とMTシステム  先月9月14日午後2時に、JAXAのイプシロンロケットが無事打上げに成功しました。成否を左右する「ロケ...


半導体製造プロセスにおけるパラメータ設計とT法の併用による超効率的条件最適化

これは2010年の品質工学研究発表大会で、東芝の岡川宏之さんが発表した「半導体製造プロセスにおけるT法活用による超効率的プロセス条件最適化」を要約したもの...

これは2010年の品質工学研究発表大会で、東芝の岡川宏之さんが発表した「半導体製造プロセスにおけるT法活用による超効率的プロセス条件最適化」を要約したもの...