MTシステム超入門(その11)

投稿日

41.サイコロと統計

 サイコロを100回振って同じ目が30回出たら「おかしい」と感じますが、統計ではどう解釈しているのでしょうか。1から6までの目の出る確率は1/6ですから、100回振ったときのそれぞれの目の出る回数は17回程度です。ですから、30回も同じ目が出ることはめったにありません。これを統計で計算すると、30回同じ目が出る確率は0.5%以下です。逆に言えば、100回サイコロを振る実験を200回繰り返すと、1回はそのような場合があり得ます。

 

42.プロ野球のボールと確率

 プロ野球のボールが、飛ぶ仕様に変えられていたことが話題になりました。数十試合経過した段階でのホームラン数の多さは、ボールなどの条件が変わっていない限り、統計的には発生確率が1%なのだそうです(NHK「クローズアップ現代」より)。ただ、逆に言えば100年に一度はあり得るということにもなります。

 

43.統計は「絶対」とは言ってくれない

 サイコロを100回振って、同じ目が30回以上出る確率は0.5%以下でした。野球のボールが変わっていないのに、多くの本塁打が出る確率は1%でした。ところが、「絶対にサイコロやボールがおかしい」と言い切れる確率は、データを増やしてもどうしても100%にはなりません。それが統計のはじき出す回答です。「あり得る確率は*%以下」が示されるだけです。つまり数理的な参考値にはなりますが、最後の決断は人間に任されます。  では、統計の値がどうであれば人は「こう決断しよう」ということになるのでしょうか。あり得る確率が1%以下なら、決断できるのでしょうか。それはいろいろな前提により異なるでしょう。  友達どうしのゲームで使うサイコロなら、「もう100回振ってみて、同じようならそのサイコロを使うのはやめよう」となります。 しかし、「間違えたら罰金1000万円です」という立場に追い込まれたなら、言い切れる確率がもっと十分な値に近づく方法を探すことになるでしょう。

 

44.M距離の統計的な意味

 以前「M距離は4以下であれば、ほぼ元のパターンの仲間」と書きましたが、それは「4を超えたら元のパターンの仲間とは言わないことにしよう」ということです。仲間と言える確率が小さいからです。  「統計は数値(確率)を提示し、それをどう扱うかは最終的には人間の決断」なのですが、その事情はM距離も同じです。サイコロと同じようにM距離の信頼度を確率で論じることができます。  M距離は1とか2であれば、「仲間とは言えない確率」が小さく、4,5…と大きくなると確率が大きくなります。ですから、どこかで境界の値(しきい値)を設けます。この境界を決めるのが人なのです。その境界の値もサイコロのときと同じ...

41.サイコロと統計

 サイコロを100回振って同じ目が30回出たら「おかしい」と感じますが、統計ではどう解釈しているのでしょうか。1から6までの目の出る確率は1/6ですから、100回振ったときのそれぞれの目の出る回数は17回程度です。ですから、30回も同じ目が出ることはめったにありません。これを統計で計算すると、30回同じ目が出る確率は0.5%以下です。逆に言えば、100回サイコロを振る実験を200回繰り返すと、1回はそのような場合があり得ます。

 

42.プロ野球のボールと確率

 プロ野球のボールが、飛ぶ仕様に変えられていたことが話題になりました。数十試合経過した段階でのホームラン数の多さは、ボールなどの条件が変わっていない限り、統計的には発生確率が1%なのだそうです(NHK「クローズアップ現代」より)。ただ、逆に言えば100年に一度はあり得るということにもなります。

 

43.統計は「絶対」とは言ってくれない

 サイコロを100回振って、同じ目が30回以上出る確率は0.5%以下でした。野球のボールが変わっていないのに、多くの本塁打が出る確率は1%でした。ところが、「絶対にサイコロやボールがおかしい」と言い切れる確率は、データを増やしてもどうしても100%にはなりません。それが統計のはじき出す回答です。「あり得る確率は*%以下」が示されるだけです。つまり数理的な参考値にはなりますが、最後の決断は人間に任されます。  では、統計の値がどうであれば人は「こう決断しよう」ということになるのでしょうか。あり得る確率が1%以下なら、決断できるのでしょうか。それはいろいろな前提により異なるでしょう。  友達どうしのゲームで使うサイコロなら、「もう100回振ってみて、同じようならそのサイコロを使うのはやめよう」となります。 しかし、「間違えたら罰金1000万円です」という立場に追い込まれたなら、言い切れる確率がもっと十分な値に近づく方法を探すことになるでしょう。

 

44.M距離の統計的な意味

 以前「M距離は4以下であれば、ほぼ元のパターンの仲間」と書きましたが、それは「4を超えたら元のパターンの仲間とは言わないことにしよう」ということです。仲間と言える確率が小さいからです。  「統計は数値(確率)を提示し、それをどう扱うかは最終的には人間の決断」なのですが、その事情はM距離も同じです。サイコロと同じようにM距離の信頼度を確率で論じることができます。  M距離は1とか2であれば、「仲間とは言えない確率」が小さく、4,5…と大きくなると確率が大きくなります。ですから、どこかで境界の値(しきい値)を設けます。この境界を決めるのが人なのです。その境界の値もサイコロのときと同じで、間違えたときの損失を考えながら決めることになります。5と書いたのに5と読まなかった損失と、6と書いたのに5と読んでしまった損失の両方があります。

 

45.統計の嘘にも気を付けよう

 「統計は最強」は統計学者の方々が主張したいことですが、「統計の嘘」ということもいろいろな方々から言われます。ちょっとヘンだな、という事例をいくつかご紹介します。

①日本の家庭の平均貯蓄額は1300万円

②ウィスキーに水を混ぜて飲むと酔います。焼酎にお湯を混ぜて飲むと酔います。したがって、共通している液体である水を飲むと酔います。

③日本人が好きなある食料を食べる人の40%は癌になります

   続きを読むには・・・


この記事の著者

手島 昌一

データ解析やパターン認識をしてみたいけれど難しそう、と考えていませんか? MTシステムは“分かった”,“使える”への最適解です。

データ解析やパターン認識をしてみたいけれど難しそう、と考えていませんか? MTシステムは“分かった”,“使える”への最適解です。


「MTシステム」の他のキーワード解説記事

もっと見る
様々な特徴量を用いてのMT法解析

 MT法は多変量解析法の一種で、結果の信頼性が高く使いやすい手法です。最近は専用のソフトウェアがいくつか用意されていますので、データが揃えばすぐに使うこと...

 MT法は多変量解析法の一種で、結果の信頼性が高く使いやすい手法です。最近は専用のソフトウェアがいくつか用意されていますので、データが揃えばすぐに使うこと...


MTAと余因子(Ⅰ)

 MT法の一つ、MTA法(マハラノビス・タグチ・アジョイント法)は、逆行列が存在しない場合の逃げテクでもありました。一方、キーワードである「余因子」に...

 MT法の一つ、MTA法(マハラノビス・タグチ・アジョイント法)は、逆行列が存在しない場合の逃げテクでもありました。一方、キーワードである「余因子」に...


MTシステム超入門(その22)

1.MTシステムにおけるマハラノビス距離  MTシステムが論文の形で提案されて、ほぼ20年が経ちます。田口玄一博士が品質工学誌に掲載したものが最初です。...

1.MTシステムにおけるマハラノビス距離  MTシステムが論文の形で提案されて、ほぼ20年が経ちます。田口玄一博士が品質工学誌に掲載したものが最初です。...


「MTシステム」の活用事例

もっと見る
半導体製造プロセスにおけるパラメータ設計とT法の併用による超効率的条件最適化

これは2010年の品質工学研究発表大会で、東芝の岡川宏之さんが発表した「半導体製造プロセスにおけるT法活用による超効率的プロセス条件最適化」を要約したもの...

これは2010年の品質工学研究発表大会で、東芝の岡川宏之さんが発表した「半導体製造プロセスにおけるT法活用による超効率的プロセス条件最適化」を要約したもの...


イプシロンロケットとMTシステム

1.イプシロンロケット打上げ成功とMTシステム  先月9月14日午後2時に、JAXAのイプシロンロケットが無事打上げに成功しました。成否を左右する「ロケ...

1.イプシロンロケット打上げ成功とMTシステム  先月9月14日午後2時に、JAXAのイプシロンロケットが無事打上げに成功しました。成否を左右する「ロケ...


T法によって拡張されたパラメータ・スタディー

 これは2012年の品質工学研究発表大会で、リコーの細川哲夫さんが発表した「T法によって拡張されたパラメータ・スタディー」を、ご本人の承諾を得て要約掲載し...

 これは2012年の品質工学研究発表大会で、リコーの細川哲夫さんが発表した「T法によって拡張されたパラメータ・スタディー」を、ご本人の承諾を得て要約掲載し...