「分かっていないこと」(データの裏付けのない「事実」) データ分析講座(その19)

更新日

投稿日

 

情報マネジメント

◆ 最初に「データで把握すべき最重要なこと」は、「分かっていないこと」を把握すること

 「データからどのように読み取り、どのように施策に落とすかで、足踏みしている」このようなことを仰った、某企業の経営企画室長の方がいました。データはただ取得し「見える化」しただけでは、何も起こりません。データから何を読み取り、どのように「解釈」し、そして未来に繋げるためにどのようなアクションをすべきを、考える必要があります。データを「見える化」した後の最初の壁が「解釈」です。データから読み取った「事実」をもとに、どのように「解釈」すべきか、という問題です。

1. パウエルの消せない過ち

 2003年のイラク戦争へと踏む出すきっかけの一つになった、当時の米国のパウエル国務長官の国連演説があります。その演説で、パウエル国務長官は「イラクに大量破壊兵器が存在する」と言及しました。2001年の同時多発テロの影響もあり、イラクが大量破壊兵器を保有しているなら攻撃すべしという、国民感情が少なからずあったこと、イラク自体が査察団に対し非協力的だったこと、そして間違った情報を鵜呑みにしたことなどが、そう判断させた背景にあります。パウエル氏は、後にこのことを「消せない過ち」と自伝で述べています。

 問題は、「イラクが大量破壊兵器の製造装置をトラックに積んでいた」という間違った情報を鵜呑みにしたことです。限られた時間の中で結論を出さないとき、得られている情報が限られています。限られた時間の中で限られた情報をもとに判断をするとき、得られたデータなどの情報から、どのような「事実」を「確度の高い事実」としてとらえるのかが重要になっています。この反省から、パウエルの情報四か条というものが存在します。

2. パウエルの情報四か条

 パウエルの情報四か条とは次の四か条を、国の軍や情報などの関係者が、壁などに張って教訓にしています。

  •  分かっていることを言え
  •  分かっていないことを言え
  •  その上で、どう考えるのかを言え
  •  この3つを区別しろ

【出典】コリン・パウエル等著『リーダーを目指す人の心得』

 データ活用という視点で考えると、データ分析結果から得られた「事実」が「分かっていること」です。しかし、データから導き出される「事実」は限られています。多くの事実はデータに現れませんし、そもそもデータとして収集しきれていません。このような、データから得られていない「事実」が「分かっていないこと」です。要するに、データの裏付けのある「事実」が「分かっていること」、データの裏付けのない「事実」が「分かっていないこと」です。

 パウエル氏のケースの場合、「イラクが大量破壊兵器の製造装置をトラックに積んでいた」というのはデータの裏付けの乏しい「事実」、つまり、「分かっていないこと」だったのです。

 データから「事実」を把握し後に「解釈」をしなければなりません。そのとき、「分かっていること」(データの裏付けのある「事実」)と「分かっていないこと」(データの裏付けのない「事実」)から「解釈」する必要があります。その「解釈」が、パウエルの四か条の「どう考えるのか」に該当します。この3つを明確に区別しろという教訓です。

3. 事実誤認の可能性を減らすことが最重要

 パウエル氏の過ちは、「イラクが大量破壊兵器の製造装置をトラックに積んでいた」というのはデータの裏付けの乏しい「事実」を、「分かっていること」(データの裏付けのある「事実」)としてしまったことです。そのことが前提で「解釈」をしてしまったことにあります。このようなことを、事実誤認と言います。本当かどうかわからない事実を、事実として扱ってしまうことです。

 多くの企業でも、こういうケースはあるのではないでしょうか。

 データの根拠が乏しいのに、既成事実化していることや、当然のこととして扱われている事実です。よくよく調べてみると、根拠になりえるようなデータがほとんどないのです。多くの場合は、思い込みです。本人にとっては事実でも、それは本人の心の中の事実であって、客観的な事実ではありません。では、「分かっていないこと」(データの裏付けのない「事実」)は悪なのかと言うと、そうではありません。

 過ちは誰にでもあります。重要なのは、「分かっていること」(データの裏付けのある「事実」)と「分かっていないこと」(データの裏付けのない「事実」)、そして「分かっていること」と「分かっていないこと」をもとに「どう考えるたのか」(「解釈」)を明確に区別することです。少なくとも、「分かっていないこと」(データの裏付けのない「事実」)を最大の根拠にしてはいけないということです。

4. 「分かっていないこと」が解釈を促す

 データ活用と考えると、どうしてもデータを集計したり分析した結果をもとに「事実」を整理し「解釈」しがちです。つまり、「分かっていること」(データの裏付けのある「事実」)だけで、「解釈」しようとしてしまいます。そして、多くの場合「解釈」できずに悩みます。なぜならば、データから導き出される「事実」は限られており、多くの事実はデータに現れないからです。「分かっていないこと」(データの裏付けのない「事実」)がないことには、「解釈」が非常に難しくなります。「分かっていること」(データの裏付けのある「事実」)だけで考えるとは、例えば10,000ピースのジグソーパズルで、100ピースしか揃っていない時点で全体像を見るかのようです。

 「事実」を整理する段階で最も重要なのが、「分かっていないこと」(データの裏付けのない「事実」)の把握です。「分かっていること」(データの裏付けのある「事実」)を把握する以上に重要です。要するに、「データの裏付けが取れたこと」は何で、「データの裏付けのとれなかった不明なこと」は何か、を明確に分けて把握することです。

 再度述べますが、「解釈」するときに、データ分析結果などから導いた「事実」だけでは不可能です。

 データは、単なる断片的な情報を与えてくるに過ぎません。データから得られた断片的な「事実」をつなぎ合わせる必要があります。データ...

 

情報マネジメント

◆ 最初に「データで把握すべき最重要なこと」は、「分かっていないこと」を把握すること

 「データからどのように読み取り、どのように施策に落とすかで、足踏みしている」このようなことを仰った、某企業の経営企画室長の方がいました。データはただ取得し「見える化」しただけでは、何も起こりません。データから何を読み取り、どのように「解釈」し、そして未来に繋げるためにどのようなアクションをすべきを、考える必要があります。データを「見える化」した後の最初の壁が「解釈」です。データから読み取った「事実」をもとに、どのように「解釈」すべきか、という問題です。

1. パウエルの消せない過ち

 2003年のイラク戦争へと踏む出すきっかけの一つになった、当時の米国のパウエル国務長官の国連演説があります。その演説で、パウエル国務長官は「イラクに大量破壊兵器が存在する」と言及しました。2001年の同時多発テロの影響もあり、イラクが大量破壊兵器を保有しているなら攻撃すべしという、国民感情が少なからずあったこと、イラク自体が査察団に対し非協力的だったこと、そして間違った情報を鵜呑みにしたことなどが、そう判断させた背景にあります。パウエル氏は、後にこのことを「消せない過ち」と自伝で述べています。

 問題は、「イラクが大量破壊兵器の製造装置をトラックに積んでいた」という間違った情報を鵜呑みにしたことです。限られた時間の中で結論を出さないとき、得られている情報が限られています。限られた時間の中で限られた情報をもとに判断をするとき、得られたデータなどの情報から、どのような「事実」を「確度の高い事実」としてとらえるのかが重要になっています。この反省から、パウエルの情報四か条というものが存在します。

2. パウエルの情報四か条

 パウエルの情報四か条とは次の四か条を、国の軍や情報などの関係者が、壁などに張って教訓にしています。

  •  分かっていることを言え
  •  分かっていないことを言え
  •  その上で、どう考えるのかを言え
  •  この3つを区別しろ

【出典】コリン・パウエル等著『リーダーを目指す人の心得』

 データ活用という視点で考えると、データ分析結果から得られた「事実」が「分かっていること」です。しかし、データから導き出される「事実」は限られています。多くの事実はデータに現れませんし、そもそもデータとして収集しきれていません。このような、データから得られていない「事実」が「分かっていないこと」です。要するに、データの裏付けのある「事実」が「分かっていること」、データの裏付けのない「事実」が「分かっていないこと」です。

 パウエル氏のケースの場合、「イラクが大量破壊兵器の製造装置をトラックに積んでいた」というのはデータの裏付けの乏しい「事実」、つまり、「分かっていないこと」だったのです。

 データから「事実」を把握し後に「解釈」をしなければなりません。そのとき、「分かっていること」(データの裏付けのある「事実」)と「分かっていないこと」(データの裏付けのない「事実」)から「解釈」する必要があります。その「解釈」が、パウエルの四か条の「どう考えるのか」に該当します。この3つを明確に区別しろという教訓です。

3. 事実誤認の可能性を減らすことが最重要

 パウエル氏の過ちは、「イラクが大量破壊兵器の製造装置をトラックに積んでいた」というのはデータの裏付けの乏しい「事実」を、「分かっていること」(データの裏付けのある「事実」)としてしまったことです。そのことが前提で「解釈」をしてしまったことにあります。このようなことを、事実誤認と言います。本当かどうかわからない事実を、事実として扱ってしまうことです。

 多くの企業でも、こういうケースはあるのではないでしょうか。

 データの根拠が乏しいのに、既成事実化していることや、当然のこととして扱われている事実です。よくよく調べてみると、根拠になりえるようなデータがほとんどないのです。多くの場合は、思い込みです。本人にとっては事実でも、それは本人の心の中の事実であって、客観的な事実ではありません。では、「分かっていないこと」(データの裏付けのない「事実」)は悪なのかと言うと、そうではありません。

 過ちは誰にでもあります。重要なのは、「分かっていること」(データの裏付けのある「事実」)と「分かっていないこと」(データの裏付けのない「事実」)、そして「分かっていること」と「分かっていないこと」をもとに「どう考えるたのか」(「解釈」)を明確に区別することです。少なくとも、「分かっていないこと」(データの裏付けのない「事実」)を最大の根拠にしてはいけないということです。

4. 「分かっていないこと」が解釈を促す

 データ活用と考えると、どうしてもデータを集計したり分析した結果をもとに「事実」を整理し「解釈」しがちです。つまり、「分かっていること」(データの裏付けのある「事実」)だけで、「解釈」しようとしてしまいます。そして、多くの場合「解釈」できずに悩みます。なぜならば、データから導き出される「事実」は限られており、多くの事実はデータに現れないからです。「分かっていないこと」(データの裏付けのない「事実」)がないことには、「解釈」が非常に難しくなります。「分かっていること」(データの裏付けのある「事実」)だけで考えるとは、例えば10,000ピースのジグソーパズルで、100ピースしか揃っていない時点で全体像を見るかのようです。

 「事実」を整理する段階で最も重要なのが、「分かっていないこと」(データの裏付けのない「事実」)の把握です。「分かっていること」(データの裏付けのある「事実」)を把握する以上に重要です。要するに、「データの裏付けが取れたこと」は何で、「データの裏付けのとれなかった不明なこと」は何か、を明確に分けて把握することです。

 再度述べますが、「解釈」するときに、データ分析結果などから導いた「事実」だけでは不可能です。

 データは、単なる断片的な情報を与えてくるに過ぎません。データから得られた断片的な「事実」をつなぎ合わせる必要があります。データから得られた「事実」をつなぎ合わせるために必要となるのが、「分かっていないこと」(データの裏付けのない「事実」)なのです。「分かっていないこと」(データの裏付けのない「事実」)を想像できないと、データから得られた「事実」を「解釈」することができません。

5. 「分かっていないこと」という「仮説」がキーである

 「分かっていないこと」(データの裏付けのない「事実」)を想像することは、データ活用をする上でキーとなる重要な知的活動なのです。ちょっとかっこよく言うと、「分かっていないこと」(データの裏付けのない「事実」)を想像し明確化したものを「仮説」もしくは「仮置き」と言います。データの「見える化」で止まっているケースの多くが、「分かっていないこと」(データの裏付けのない「事実」)を想像しない、もしくは、できないという問題があります。データの裏付けがある「事実」だけで、どうなっていたのかを「解釈」することは、ほぼ不可能です。

 「分かっていないこと」(データの裏付けのない「事実」)を積極的に、意識して考える必要があります。問題は、それを「分かっていないこと」(データの裏付けのない「事実」)を「分かっていること」(データの裏付けのある「事実」)と見なしてしまう、事実誤認です。この点に最大限の注意を払う必要があります。要するに、最初にデータで把握すべき最重要なことは、「分かっていないこと」(データの裏付けのない「事実」)を把握することです。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
時系列データ データ分析講座(その33)

◆ 異常検知とデータ分析は、切っても切り離せない  モニタリングする指標の多くは、時系列データといわれるものです。時系列データとは、一定間隔(例:1...

◆ 異常検知とデータ分析は、切っても切り離せない  モニタリングする指標の多くは、時系列データといわれるものです。時系列データとは、一定間隔(例:1...


データ分析経験者の中途採用 データ分析講座(その60)

◆ 売上分析やマーケティングのデータ分析で成果を出したいなら、OUTPUTよりもOUTCOMEにこだわれ  データを集めたけど…&he...

◆ 売上分析やマーケティングのデータ分析で成果を出したいなら、OUTPUTよりもOUTCOMEにこだわれ  データを集めたけど…&he...


A/Bテストの7ステップ データ分析講座(その269)

  データサイエンティストがA/Bテストを行う方法は近年大きく変化しています。従来は手作業で行うものが多い印象がありましたが、現在は色々な...

  データサイエンティストがA/Bテストを行う方法は近年大きく変化しています。従来は手作業で行うものが多い印象がありましたが、現在は色々な...


「情報マネジメント一般」の活用事例

もっと見る
中小企業のセキュリティ対策を考える

◆ 企業の情報セキュリティと新型コロナウィルス対策の今  先日、駅のプラットフォ-ムで並んでいる時に、控えめに咳をしたら、前に並んでいた人にすかさず...

◆ 企業の情報セキュリティと新型コロナウィルス対策の今  先日、駅のプラットフォ-ムで並んでいる時に、控えめに咳をしたら、前に並んでいた人にすかさず...


P値で行う統計リテラシー判定

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...


‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...