現場感とデータ分析 データ分析講座(その219)

投稿日

データ分析

 

【この連載の前回:データ分析講座(その218)見える化の魔力へのリンク】

データから新たな知見を得たい! という要望は、昔からあります。仮説発見をするぞという、データマイニングがその現れでしょう。従来のメインが「仮説検証型データ分析」で、それを進化させたような感じを与えるようなモノでした。最近ですと、未来創造型と言えそうです。仮説検証から仮説発見へ、仮説発見から未来創造へ、ということです。

 

「未来創造型データ分析」はさておき、仮説発見は本当に起こり得るのでしょうか?今回は、「現場感とデータ分析(どちらかというと仮説探索型データ分析)」というお話しをします。

【目次】
1.仮説発見
2.データは過去の一部分に過ぎない
3.現場から見たら当然のことが多い
4.現場感に合わないデータ分析結果は怪しいケースが多い
5.記録は何のためにする?
6.どちらかというと、仮説探索型

 

1.仮説発見

「仮説発見型データ分析」とは、「缶ビールと紙おむつが同時購買されている!」みたいな新たなルールをデータから発見することです。

 

「缶ビールと紙おむつ」の事例
1998年の米国のForbes誌で紹介されたものです。当時のNCR社が米国にある小売店であるオスコのデータを分析して得た併買ルールです。この新たに発見されたルールで収益を拡大したとは、Forbes誌には記載されていません。

 

「発見」とは「今まで知られていない物事を初めて見いだすこと」です。「今まで知られていない物事を初めて見いだすこと」は、本当にデータで可能なのでしょうか?

 

2.データは過去の一部分に過ぎない

当然のことですが、データは過去の一部分に過ぎません。要するに、過去全体を知ることはできません。そのため、データ分析をするとき、分析者の洞察力や前提になる知識が必要になってきます。

 

「缶ビールと紙おむつが同時購買されている!」というデータ分析結果を見たとき、洞察力や前提知識などによって、反応が異なり、次のように分かれます。

  • 現場から見たら「わかる、わかる」
  • 現場から距離があるほど「へぇ、面白い」

 

3.現場から見たら当然のことが多い

データは過去の一部分に過ぎません。データの発生源に近いところで働いている現場の人にとって、毎日のように接している事象です。先ほどの「缶ビールと紙おむつ」で考えると、本当に缶ビールと紙おむつがよく併買されているのなら、レジ係は知っているはずです。毎日のように目の前で見ていますし、そのレジ打ちをするからです。

 

現場から距離があるほど、この事実を知りません。現場を知らないからです。

 

4.現場感に合わないデータ分析結果は怪しいケースが多い

データ分析結果を現場の人に見てもらうことは非常に重要です。現場感に合わないデータ分析結果は怪しいケースが多いからです。現場にとって全く身に覚えのないことがデータに記録されることは、稀だからです。現場から距離のある人にデータ分析結果を見てもらい、「面白い! 使える! これいいね!」と言ってもらえても、現場から見たら「そんなことはない」となることもあります。それは、どこかでミスっているのです。

 

5.記録は何のためにする?

データは、過去の一部分を記録したものです。記録は何のためにするのでしょうか?答えは人それぞれだとは思いますが、例えば「思い出すため」という用途もあるのではないでしょうか。データを分析し、現場の人に見てもらったときに、「あぁ確かに、こんなことあった」という感じです。

 

さらに、「何となく分かっていた現実」を再認識させるという用途もありそ...

データ分析

 

【この連載の前回:データ分析講座(その218)見える化の魔力へのリンク】

データから新たな知見を得たい! という要望は、昔からあります。仮説発見をするぞという、データマイニングがその現れでしょう。従来のメインが「仮説検証型データ分析」で、それを進化させたような感じを与えるようなモノでした。最近ですと、未来創造型と言えそうです。仮説検証から仮説発見へ、仮説発見から未来創造へ、ということです。

 

「未来創造型データ分析」はさておき、仮説発見は本当に起こり得るのでしょうか?今回は、「現場感とデータ分析(どちらかというと仮説探索型データ分析)」というお話しをします。

【目次】
1.仮説発見
2.データは過去の一部分に過ぎない
3.現場から見たら当然のことが多い
4.現場感に合わないデータ分析結果は怪しいケースが多い
5.記録は何のためにする?
6.どちらかというと、仮説探索型

 

1.仮説発見

「仮説発見型データ分析」とは、「缶ビールと紙おむつが同時購買されている!」みたいな新たなルールをデータから発見することです。

 

「缶ビールと紙おむつ」の事例
1998年の米国のForbes誌で紹介されたものです。当時のNCR社が米国にある小売店であるオスコのデータを分析して得た併買ルールです。この新たに発見されたルールで収益を拡大したとは、Forbes誌には記載されていません。

 

「発見」とは「今まで知られていない物事を初めて見いだすこと」です。「今まで知られていない物事を初めて見いだすこと」は、本当にデータで可能なのでしょうか?

 

2.データは過去の一部分に過ぎない

当然のことですが、データは過去の一部分に過ぎません。要するに、過去全体を知ることはできません。そのため、データ分析をするとき、分析者の洞察力や前提になる知識が必要になってきます。

 

「缶ビールと紙おむつが同時購買されている!」というデータ分析結果を見たとき、洞察力や前提知識などによって、反応が異なり、次のように分かれます。

  • 現場から見たら「わかる、わかる」
  • 現場から距離があるほど「へぇ、面白い」

 

3.現場から見たら当然のことが多い

データは過去の一部分に過ぎません。データの発生源に近いところで働いている現場の人にとって、毎日のように接している事象です。先ほどの「缶ビールと紙おむつ」で考えると、本当に缶ビールと紙おむつがよく併買されているのなら、レジ係は知っているはずです。毎日のように目の前で見ていますし、そのレジ打ちをするからです。

 

現場から距離があるほど、この事実を知りません。現場を知らないからです。

 

4.現場感に合わないデータ分析結果は怪しいケースが多い

データ分析結果を現場の人に見てもらうことは非常に重要です。現場感に合わないデータ分析結果は怪しいケースが多いからです。現場にとって全く身に覚えのないことがデータに記録されることは、稀だからです。現場から距離のある人にデータ分析結果を見てもらい、「面白い! 使える! これいいね!」と言ってもらえても、現場から見たら「そんなことはない」となることもあります。それは、どこかでミスっているのです。

 

5.記録は何のためにする?

データは、過去の一部分を記録したものです。記録は何のためにするのでしょうか?答えは人それぞれだとは思いますが、例えば「思い出すため」という用途もあるのではないでしょうか。データを分析し、現場の人に見てもらったときに、「あぁ確かに、こんなことあった」という感じです。

 

さらに、「何となく分かっていた現実」を再認識させるという用途もありそうです。

 

6.どちらかというと、仮説探索型

冒頭に、「缶ビールと紙おむつが同時購買されている!」というお話しをしました。

 

このような新たなルールをデータから見つけるのは、どちらかというと「仮説探索型データ分析」といった方がしっくりきます。「発見」(知られていないことを初めて見いだす)というよりも「探索」(見落しているものを探している)という感じです。

 

データを使い、見落しているものを探し出し炙り出す、そんな感じです。炙り出された現実の多くは、現場感と合うケースが多いのです。ちなみに、データから知られていないことを初めて見いだす「発見」の可能性が皆無ではありません。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
見積システムによるDX(その2)

  【目次】 1.アナログ情報をデジタル化 2.プロセス全体をデジタル化 3.価値の創造と利益の拡大   ここ...

  【目次】 1.アナログ情報をデジタル化 2.プロセス全体をデジタル化 3.価値の創造と利益の拡大   ここ...


ビジネスに貢献し周囲に認められ感謝されるデータ分析 データ分析講座(その74)

◆ 精度が0.1%改善!だからどうしたと、周囲から不思議がられる分析結果  誰かを馬鹿にしたり、自虐的になっているわけでもありません。データ分析系の...

◆ 精度が0.1%改善!だからどうしたと、周囲から不思議がられる分析結果  誰かを馬鹿にしたり、自虐的になっているわけでもありません。データ分析系の...


ダッシュボードとビジネス目標:データ分析講座(その313)

       データ活用の浸透とともに、ダッシュボードを利用する人や組織、企業などが増えてきました。ダッシュ...

       データ活用の浸透とともに、ダッシュボードを利用する人や組織、企業などが増えてきました。ダッシュ...


「情報マネジメント一般」の活用事例

もっと見る
現場のExcel依存に注意しよう

 マイクロソフトの「Excel」は企業の業務遂行にとって欠かせないツールになりました。数字の集計、グラフの作成にとどまらず、作業伝票の発行、作業の管理、資...

 マイクロソフトの「Excel」は企業の業務遂行にとって欠かせないツールになりました。数字の集計、グラフの作成にとどまらず、作業伝票の発行、作業の管理、資...


人的資源マネジメント:製品開発の滞留を引き起こすファイルとは(その2)

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...


レストランでのタブレット端末

        最近、テーブルにタブレット端末を置くレストランが増えています。レストラン利用者としては、ウェ...

        最近、テーブルにタブレット端末を置くレストランが増えています。レストラン利用者としては、ウェ...