現場感とデータ分析 データ分析講座(その219)

投稿日

データ分析

 

【この連載の前回:データ分析講座(その218)見える化の魔力へのリンク】

データから新たな知見を得たい! という要望は、昔からあります。仮説発見をするぞという、データマイニングがその現れでしょう。従来のメインが「仮説検証型データ分析」で、それを進化させたような感じを与えるようなモノでした。最近ですと、未来創造型と言えそうです。仮説検証から仮説発見へ、仮説発見から未来創造へ、ということです。

 

「未来創造型データ分析」はさておき、仮説発見は本当に起こり得るのでしょうか?今回は、「現場感とデータ分析(どちらかというと仮説探索型データ分析)」というお話しをします。

【目次】
1.仮説発見
2.データは過去の一部分に過ぎない
3.現場から見たら当然のことが多い
4.現場感に合わないデータ分析結果は怪しいケースが多い
5.記録は何のためにする?
6.どちらかというと、仮説探索型

 

1.仮説発見

「仮説発見型データ分析」とは、「缶ビールと紙おむつが同時購買されている!」みたいな新たなルールをデータから発見することです。

 

「缶ビールと紙おむつ」の事例
1998年の米国のForbes誌で紹介されたものです。当時のNCR社が米国にある小売店であるオスコのデータを分析して得た併買ルールです。この新たに発見されたルールで収益を拡大したとは、Forbes誌には記載されていません。

 

「発見」とは「今まで知られていない物事を初めて見いだすこと」です。「今まで知られていない物事を初めて見いだすこと」は、本当にデータで可能なのでしょうか?

 

2.データは過去の一部分に過ぎない

当然のことですが、データは過去の一部分に過ぎません。要するに、過去全体を知ることはできません。そのため、データ分析をするとき、分析者の洞察力や前提になる知識が必要になってきます。

 

「缶ビールと紙おむつが同時購買されている!」というデータ分析結果を見たとき、洞察力や前提知識などによって、反応が異なり、次のように分かれます。

  • 現場から見たら「わかる、わかる」
  • 現場から距離があるほど「へぇ、面白い」

 

3.現場から見たら当然のことが多い

データは過去の一部分に過ぎません。データの発生源に近いところで働いている現場の人にとって、毎日のように接している事象です。先ほどの「缶ビールと紙おむつ」で考えると、本当に缶ビールと紙おむつがよく併買されているのなら、レジ係は知っているはずです。毎日のように目の前で見ていますし、そのレジ打ちをするからです。

 

現場から距離があるほど、この事実を知りません。現場を知らないからです。

 

4.現場感に合わないデータ分析結果は怪しいケースが多い

データ分析結果を現場の人に見てもらうことは非常に重要です。現場感に合わないデータ分析結果は怪しいケースが多いからです。現場にとって全く身に覚えのないことがデータに記録されることは、稀だからです。現場から距離のある人にデータ分析結果を見てもらい、「面白い! 使える! これいいね!」と言ってもらえても、現場から見たら「そんなことはない」となることもあります。それは、どこかでミスっているのです。

 

5.記録は何のためにする?

データは、過去の一部分を記録したものです。記録は何のためにするのでしょうか?答えは人それぞれだとは思いますが、例えば「思い出すため」という用途もあるのではないでしょうか。データを分析し、現場の人に見てもらったときに、「あぁ確かに、こんなことあった」という感じです。

 

さらに、「何となく分かっていた現実」を再認識させるという用途もありそ...

データ分析

 

【この連載の前回:データ分析講座(その218)見える化の魔力へのリンク】

データから新たな知見を得たい! という要望は、昔からあります。仮説発見をするぞという、データマイニングがその現れでしょう。従来のメインが「仮説検証型データ分析」で、それを進化させたような感じを与えるようなモノでした。最近ですと、未来創造型と言えそうです。仮説検証から仮説発見へ、仮説発見から未来創造へ、ということです。

 

「未来創造型データ分析」はさておき、仮説発見は本当に起こり得るのでしょうか?今回は、「現場感とデータ分析(どちらかというと仮説探索型データ分析)」というお話しをします。

【目次】
1.仮説発見
2.データは過去の一部分に過ぎない
3.現場から見たら当然のことが多い
4.現場感に合わないデータ分析結果は怪しいケースが多い
5.記録は何のためにする?
6.どちらかというと、仮説探索型

 

1.仮説発見

「仮説発見型データ分析」とは、「缶ビールと紙おむつが同時購買されている!」みたいな新たなルールをデータから発見することです。

 

「缶ビールと紙おむつ」の事例
1998年の米国のForbes誌で紹介されたものです。当時のNCR社が米国にある小売店であるオスコのデータを分析して得た併買ルールです。この新たに発見されたルールで収益を拡大したとは、Forbes誌には記載されていません。

 

「発見」とは「今まで知られていない物事を初めて見いだすこと」です。「今まで知られていない物事を初めて見いだすこと」は、本当にデータで可能なのでしょうか?

 

2.データは過去の一部分に過ぎない

当然のことですが、データは過去の一部分に過ぎません。要するに、過去全体を知ることはできません。そのため、データ分析をするとき、分析者の洞察力や前提になる知識が必要になってきます。

 

「缶ビールと紙おむつが同時購買されている!」というデータ分析結果を見たとき、洞察力や前提知識などによって、反応が異なり、次のように分かれます。

  • 現場から見たら「わかる、わかる」
  • 現場から距離があるほど「へぇ、面白い」

 

3.現場から見たら当然のことが多い

データは過去の一部分に過ぎません。データの発生源に近いところで働いている現場の人にとって、毎日のように接している事象です。先ほどの「缶ビールと紙おむつ」で考えると、本当に缶ビールと紙おむつがよく併買されているのなら、レジ係は知っているはずです。毎日のように目の前で見ていますし、そのレジ打ちをするからです。

 

現場から距離があるほど、この事実を知りません。現場を知らないからです。

 

4.現場感に合わないデータ分析結果は怪しいケースが多い

データ分析結果を現場の人に見てもらうことは非常に重要です。現場感に合わないデータ分析結果は怪しいケースが多いからです。現場にとって全く身に覚えのないことがデータに記録されることは、稀だからです。現場から距離のある人にデータ分析結果を見てもらい、「面白い! 使える! これいいね!」と言ってもらえても、現場から見たら「そんなことはない」となることもあります。それは、どこかでミスっているのです。

 

5.記録は何のためにする?

データは、過去の一部分を記録したものです。記録は何のためにするのでしょうか?答えは人それぞれだとは思いますが、例えば「思い出すため」という用途もあるのではないでしょうか。データを分析し、現場の人に見てもらったときに、「あぁ確かに、こんなことあった」という感じです。

 

さらに、「何となく分かっていた現実」を再認識させるという用途もありそうです。

 

6.どちらかというと、仮説探索型

冒頭に、「缶ビールと紙おむつが同時購買されている!」というお話しをしました。

 

このような新たなルールをデータから見つけるのは、どちらかというと「仮説探索型データ分析」といった方がしっくりきます。「発見」(知られていないことを初めて見いだす)というよりも「探索」(見落しているものを探している)という感じです。

 

データを使い、見落しているものを探し出し炙り出す、そんな感じです。炙り出された現実の多くは、現場感と合うケースが多いのです。ちなみに、データから知られていないことを初めて見いだす「発見」の可能性が皆無ではありません。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
成果を出したいなら、汚いデータから データ分析講座(その3)

   「社内にデータが溜まっているんだけど、何かに使えないかな」よくこのような相談を受けます。できれば、収益拡大につながる儲かるデータ分析...

   「社内にデータが溜まっているんだけど、何かに使えないかな」よくこのような相談を受けます。できれば、収益拡大につながる儲かるデータ分析...


金額に近い定量的な指標とは データ分析講座(その144)

◆ データ分析・活用の成果を金額で示せばインパクト大  頑張って出したデータ分析・活用の成果を、どう表現するのかは重要です。少なくとも、データ分析・...

◆ データ分析・活用の成果を金額で示せばインパクト大  頑張って出したデータ分析・活用の成果を、どう表現するのかは重要です。少なくとも、データ分析・...


研究者の抵抗を払拭する  研究テーマの多様な情報源(その22)

1.研究者へのインパクトが見えない(オープン・イノベーションへの抵抗理由) ◆関連解説『情報マネジメントとは』    研究者に限らず企業の...

1.研究者へのインパクトが見えない(オープン・イノベーションへの抵抗理由) ◆関連解説『情報マネジメントとは』    研究者に限らず企業の...


「情報マネジメント一般」の活用事例

もっと見る
‐情報収集で配慮すべき事項(第2回)‐  製品・技術開発力強化策の事例(その10)

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


電子メール、簡潔過ぎると逆効果

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...

◆電子メール:多忙な人に確実な返信をもらうテクニック  皆様は仕事で電子メールを一日に何通受信しますか、企業の従業員数、所属部署、職務、職位などでも...


‐技術開発の目標について 第2回‐  製品・技術開発力強化策の事例(その16)

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....

 技術開発の目標を解説する以下の項目4点について、前回は、1と2を解説しましたので、今回は、第2回として、3と4を記述します。          1....