データをいくら集めても100発0中が当たり前 データ分析講座(その281)

投稿日

データ分析

 

データを使って何かを予測する、データを使って答えを導き出す、それが最適なものであると最高です。しかし、多くの場合、データを上手く活用することで、「答えの方向性」は導いてくれます。しかし、データをいくら集め上手く活用しても、ピタリと答えを当てることはできません。どういうことでしょうか。例えば、データをいくら集めても、「来月の売上は53億4,987万9,287円になります」とピタリと当てる。「設備機器は再来月の2019年10月3日15:24に故障する」とピタリと当てる。ことはほぼ不可能です。もちろん奇跡的に当たるという事はあるかもしれませんが、それは奇跡であって当然のことではありません。今回は「データをいくら集めても、100発0中が当たり前」というお話しをします。

 

【目次】
1. 的に近いところの何かを提示することは可能
2 .データは「不確実」を「リスク」にするだけ
3. リスクとは?
4. 簡単な例
5. 2つのリスク

 

【この連載の前回:(その280)データで騙す預言者になるへのリンク】

◆【特集】 連載記事紹介:連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. 的に近いところの何かを提示することは可能

データを使ってピタリと当てることはほぼ不可能です。その代わり、的に近いところの何かを提示することは可能です。

 

例えば「来月の売上は50億です」と予測する。「設備機器は来月中にメンテンナンスしましょう」と提示する。ことは可能です。

 

データがない状態の場合は、答えの方向性すら分からない「的がない状態」です。データがある状態の場合は、答えの方向性の分かる「的がある状態」です。そして、それだけ的の中心に近づけるのかは、データの量や質、予測モデルなどに依存するということです。

 

2. データは「不確実」を「リスク」にするだけ

上手くデータを活用することで「何が起こるのか予測できない不確実な状況」を「何が起こるのか予測できる状況」にする。ことができます。

 

この「何が起こるのか予測できる状況」を「リスク」と言います。要するに、データは「不確実」を「リスク」にするするのです。

 

3. リスクとは?

データは「不確実」を「リスク」にするするという話を聞いて「意味が分からない!」という方もいるかもしれません。リスクという言葉にネガティブな印象を強く持たれている方であれば、「データでリスクが生まれるなら、そんなデータ活用は嫌だ!」と思うかもしれません。

 

データ分析・活用の世界では「リスク」は「不確かさ(ばらつき)の程度」を意味します。「ますます分からない!!」という方もいると思います。

 

4. 簡単な例

簡単な例(「銀行預金」と「宝くじ」の例)を使い「不確かさ(ばらつき)の程度」について説明します。今、あなたは100万円をもっているとします。あなたには2つの選択肢があります。

  • 選択肢1:100万円すべてを銀行に預金する
  • 選択肢2:100万円すべてを使い宝くじを買う

 

銀行預金をする場合と宝くじを買う場合とでは、1年後に得られるリターンと、その「不確かさ(ばらつき)の程度」(リスク)が異なります。銀行に預金すれば、100万円+α(金利分)のリターンをほぼ確実に得られることでしょう。

 

宝くじはどうでしょうか。リターンが0円の可能性もありますし、数億円になる可能性もあります。数億円になる確度は限りなく小さいことでしょう。この例では、銀行に預金する場合のリターンの「不確かさ(ばらつき)の程度」(リスク)が小さく、宝くじを買う場合のリターンの「...

データ分析

 

データを使って何かを予測する、データを使って答えを導き出す、それが最適なものであると最高です。しかし、多くの場合、データを上手く活用することで、「答えの方向性」は導いてくれます。しかし、データをいくら集め上手く活用しても、ピタリと答えを当てることはできません。どういうことでしょうか。例えば、データをいくら集めても、「来月の売上は53億4,987万9,287円になります」とピタリと当てる。「設備機器は再来月の2019年10月3日15:24に故障する」とピタリと当てる。ことはほぼ不可能です。もちろん奇跡的に当たるという事はあるかもしれませんが、それは奇跡であって当然のことではありません。今回は「データをいくら集めても、100発0中が当たり前」というお話しをします。

 

【目次】
1. 的に近いところの何かを提示することは可能
2 .データは「不確実」を「リスク」にするだけ
3. リスクとは?
4. 簡単な例
5. 2つのリスク

 

【この連載の前回:(その280)データで騙す預言者になるへのリンク】

◆【特集】 連載記事紹介:連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. 的に近いところの何かを提示することは可能

データを使ってピタリと当てることはほぼ不可能です。その代わり、的に近いところの何かを提示することは可能です。

 

例えば「来月の売上は50億です」と予測する。「設備機器は来月中にメンテンナンスしましょう」と提示する。ことは可能です。

 

データがない状態の場合は、答えの方向性すら分からない「的がない状態」です。データがある状態の場合は、答えの方向性の分かる「的がある状態」です。そして、それだけ的の中心に近づけるのかは、データの量や質、予測モデルなどに依存するということです。

 

2. データは「不確実」を「リスク」にするだけ

上手くデータを活用することで「何が起こるのか予測できない不確実な状況」を「何が起こるのか予測できる状況」にする。ことができます。

 

この「何が起こるのか予測できる状況」を「リスク」と言います。要するに、データは「不確実」を「リスク」にするするのです。

 

3. リスクとは?

データは「不確実」を「リスク」にするするという話を聞いて「意味が分からない!」という方もいるかもしれません。リスクという言葉にネガティブな印象を強く持たれている方であれば、「データでリスクが生まれるなら、そんなデータ活用は嫌だ!」と思うかもしれません。

 

データ分析・活用の世界では「リスク」は「不確かさ(ばらつき)の程度」を意味します。「ますます分からない!!」という方もいると思います。

 

4. 簡単な例

簡単な例(「銀行預金」と「宝くじ」の例)を使い「不確かさ(ばらつき)の程度」について説明します。今、あなたは100万円をもっているとします。あなたには2つの選択肢があります。

  • 選択肢1:100万円すべてを銀行に預金する
  • 選択肢2:100万円すべてを使い宝くじを買う

 

銀行預金をする場合と宝くじを買う場合とでは、1年後に得られるリターンと、その「不確かさ(ばらつき)の程度」(リスク)が異なります。銀行に預金すれば、100万円+α(金利分)のリターンをほぼ確実に得られることでしょう。

 

宝くじはどうでしょうか。リターンが0円の可能性もありますし、数億円になる可能性もあります。数億円になる確度は限りなく小さいことでしょう。この例では、銀行に預金する場合のリターンの「不確かさ(ばらつき)の程度」(リスク)が小さく、宝くじを買う場合のリターンの「不確かさ(ばらつき)の程度」(リスク)が大きいと言えます。

 

言い換えると、銀行預金はリスクが小さく、宝くじはリスクが大きい、となります。

 

5. 2つのリスク

リスクには「ポジティブ方向のリスク」(例:リターンが高くなるリスク)。「ネガティブ方向のリスク」(例:リターンが低くなるリスク)があります。

 

ハイリスク・ハイリターンとは、大きなリターンを得る可能性はあるものの、大きなリスク(どちらに転ぶかわからない)を伴うということです。このリスク(不確かさの程度)そのものも、良質なデータをたくさん集め、素晴らしいデータ分析をすることで、より小さくすることができます。

 

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データを活用する領域とは データ分析講座(その115)

◆ドメインは、データサイエンス成功に欠かせない  データサイエンスに対して、どのような印象があるでしょうか。「データサイエンス」の字面からだと「デー...

◆ドメインは、データサイエンス成功に欠かせない  データサイエンスに対して、どのような印象があるでしょうか。「データサイエンス」の字面からだと「デー...


インダストリー4.0とFMS

 最近インダストリー(産業革命)4.0というコンセプトが注目を集めています。インダストリー4.0はドイツが発祥といわれていますが、工場内や離れた工場にある...

 最近インダストリー(産業革命)4.0というコンセプトが注目を集めています。インダストリー4.0はドイツが発祥といわれていますが、工場内や離れた工場にある...


見える化のその先へ データ分析講座(その86)

◆ 見える化のその先へ進むために、データ分析活用上必要なこと  「見える化」の掛け声とともに、何かしらのデータ蓄積基盤を整備し「見える化」に向けて動...

◆ 見える化のその先へ進むために、データ分析活用上必要なこと  「見える化」の掛け声とともに、何かしらのデータ蓄積基盤を整備し「見える化」に向けて動...


「情報マネジメント一般」の活用事例

もっと見る
‐販路開拓に関する問題事例‐ 製品・技術開発力強化策の事例(その19)

 前回の事例その18に続いて解説します。多額の資金と労力を費やして開発した知的財産をどのように活用して販路開拓に結びつけるのか、大変重要な問題ですが、販売...

 前回の事例その18に続いて解説します。多額の資金と労力を費やして開発した知的財産をどのように活用して販路開拓に結びつけるのか、大変重要な問題ですが、販売...


‐時代の流れを意識した開発テ-マの設定‐  製品・技術開発力強化策の事例(その5)

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...

 前回の事例その4に続いて解説します。時代の流れに沿う開発テ-マとして、最近では、高齢者介護機器、環境関連機器、省エネ機器、情報技術(IT)等に関心が注が...


たかがWord、されどWord

 マイクロソフトOfficeはどこでも使われているので、ITリテラシーとしてWordを使えることが求められます。『 Wordが使える 』と言っても、そのレ...

 マイクロソフトOfficeはどこでも使われているので、ITリテラシーとしてWordを使えることが求められます。『 Wordが使える 』と言っても、そのレ...