データは副産物ではなく血液である データ分析講座(その265)

投稿日

データ分析

 

IT化を進めれば、その副産物としてデータは発生します。そのデータを保存さえしていれば、その副産物としてのデータを分析し、何かに活用することができます。ただ、データを副産物として扱う限り、データは活用しにくい状態で保存され続けます。そこで、いざデータ分析や数理モデルを構築しようとすると、データ整備地獄が生まれます。今回は「データは副産物ではなく血液である」というお話しをします。

 

【目次】
1. データ整備地獄
2. どのような状態のデータが必要なのか?
3. 活用イメージが湧くか?
4. データ活用ストーリー
5. データが血液になるとき

 

【この連載の前回:データ分析講座(その264)顧客満足度・探索意向率・NPSとはへのリンク】

◆【特集】 連載記事紹介連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. データ整備地獄

データを分析する前に、データ整備のため多大な時間を犠牲にした人も多いと思います。それなりの分析に使われたことのないデータは、ほぼ汚いです。どう汚いかは一言では言えませんが、そのまま集計や分析するのが怖いぐらい汚く、そこから得られた結果は、間違った方向性へ導く可能性が高いです。そのため、多大な時間を使い、データを綺麗にする作業が発生します。

 

それがデータ整備地獄です。そのため、手軽にデータ分析や数理モデルなどを構築することができず、常にデータ整備を実施するという作業が入ってしまいます。であれば、最初からデータが綺麗な状態を保てるようにすればいいのでは、となります。

 

2. どのような状態のデータが必要なのか?

仮に、データが綺麗な状態を保てたとしても、それがデータ分析や数理モデル構築しやすい状態かは、別問題です。データは綺麗でも、データ分析や数理モデル構築のし難い状態が存在します。そこで問題になるのが「どのような状態のデータが必要なのか?」ということです。答えは簡単で「データ分析や数理モデル構築のし易い状態」となります。では、データ分析や数理モデル構築のし易い状態とは、どのような状態でしょうか?

 

3. 活用イメージが湧くか?

どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などによって、データ分析や数理モデル構築のし易い状態は変わります。ということは、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かっていればいいことになります。

 

この、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分からないケースが多々あります。分からないケースの多くは、活用イメージが明確でない場合が多いです。どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などは、その分析結果や予測結果などを、どのように活用するのかに依存します。

 

活用イメージが分かれば、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かり、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かれば、どのような状態のデータが必要なのか?が分かります。そう考えると、活用イメージのないまま、データを整備し綺麗にする作業は非常に危険です。

 

4. データ活用ストーリー

データが情報(データ分析や予測結果など)に変わり、情報(データ分析や予測結果など)がビジネス成果(Before→After)に変わる、この流れがデータ活用ストーリーです。

 

 

データ活用ストーリーを設計するときは、逆算です。

  1. どのようなビジネス成果(Before→After)を出したいのか 
  2. そのために、どのような情報(データ分析や予測結果など)を、どのように活用するのか 
  3. そのために、どのようなデータ分析や数理モデル構築などが必要なのか 
  4. そのために、どのようなデータが必要なのか

非常にシンプルなことです。

 

5. データが血液になるとき

あるビジネスのある特定の一部分に着目し、データ活用ストーリーを構築し、データからビジネス成果を出すのもいいでしょう。そのとき、IT化の副産物であったデータが、単なる副産物以上の何かに変わります。目指すべきは、副産物からの脱却ではなく、その先のビジネス活動の血液です。多くの場合、たった1つのデ...

データ分析

 

IT化を進めれば、その副産物としてデータは発生します。そのデータを保存さえしていれば、その副産物としてのデータを分析し、何かに活用することができます。ただ、データを副産物として扱う限り、データは活用しにくい状態で保存され続けます。そこで、いざデータ分析や数理モデルを構築しようとすると、データ整備地獄が生まれます。今回は「データは副産物ではなく血液である」というお話しをします。

 

【目次】
1. データ整備地獄
2. どのような状態のデータが必要なのか?
3. 活用イメージが湧くか?
4. データ活用ストーリー
5. データが血液になるとき

 

【この連載の前回:データ分析講座(その264)顧客満足度・探索意向率・NPSとはへのリンク】

◆【特集】 連載記事紹介連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!

◆データ分析講座の注目記事紹介

 

1. データ整備地獄

データを分析する前に、データ整備のため多大な時間を犠牲にした人も多いと思います。それなりの分析に使われたことのないデータは、ほぼ汚いです。どう汚いかは一言では言えませんが、そのまま集計や分析するのが怖いぐらい汚く、そこから得られた結果は、間違った方向性へ導く可能性が高いです。そのため、多大な時間を使い、データを綺麗にする作業が発生します。

 

それがデータ整備地獄です。そのため、手軽にデータ分析や数理モデルなどを構築することができず、常にデータ整備を実施するという作業が入ってしまいます。であれば、最初からデータが綺麗な状態を保てるようにすればいいのでは、となります。

 

2. どのような状態のデータが必要なのか?

仮に、データが綺麗な状態を保てたとしても、それがデータ分析や数理モデル構築しやすい状態かは、別問題です。データは綺麗でも、データ分析や数理モデル構築のし難い状態が存在します。そこで問題になるのが「どのような状態のデータが必要なのか?」ということです。答えは簡単で「データ分析や数理モデル構築のし易い状態」となります。では、データ分析や数理モデル構築のし易い状態とは、どのような状態でしょうか?

 

3. 活用イメージが湧くか?

どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などによって、データ分析や数理モデル構築のし易い状態は変わります。ということは、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かっていればいいことになります。

 

この、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分からないケースが多々あります。分からないケースの多くは、活用イメージが明確でない場合が多いです。どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などは、その分析結果や予測結果などを、どのように活用するのかに依存します。

 

活用イメージが分かれば、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かり、どのようなデータ分析をするのか? どのような数理モデルを構築するのか? などが分かれば、どのような状態のデータが必要なのか?が分かります。そう考えると、活用イメージのないまま、データを整備し綺麗にする作業は非常に危険です。

 

4. データ活用ストーリー

データが情報(データ分析や予測結果など)に変わり、情報(データ分析や予測結果など)がビジネス成果(Before→After)に変わる、この流れがデータ活用ストーリーです。

 

 

データ活用ストーリーを設計するときは、逆算です。

  1. どのようなビジネス成果(Before→After)を出したいのか 
  2. そのために、どのような情報(データ分析や予測結果など)を、どのように活用するのか 
  3. そのために、どのようなデータ分析や数理モデル構築などが必要なのか 
  4. そのために、どのようなデータが必要なのか

非常にシンプルなことです。

 

5. データが血液になるとき

あるビジネスのある特定の一部分に着目し、データ活用ストーリーを構築し、データからビジネス成果を出すのもいいでしょう。そのとき、IT化の副産物であったデータが、単なる副産物以上の何かに変わります。目指すべきは、副産物からの脱却ではなく、その先のビジネス活動の血液です。多くの場合、たった1つのデータ活用ストーリーを実現し満足することはありません。あるデータが、たった1つのデータ活用ストーリーの中だけで活用されることもありません。

 

あるデータは、色々なデータ活用ストーリーの中で活躍することでしょう。あるデータ活用ストーリーで生成された情報(データ分析や予測結果など)が、他のデータ活用ストーリーのデータや情報(データ分析や予測結果など)として扱われたりすることもあることでしょう。データ活用ストーリーが複合的に絡み合ったとき、そのときデータが血液に変わったときです。

 

では、どうすればいいのか?

 

1つ1つのデータ活用ストーリーを描き実現すること。さらに、それを他組織と共有すること。そして、他組織とやり取りできる状態にすること。まずは、1つ1つのデータ活用ストーリーを描き実現し、データからビジネス成果を産む流れを作ることです。

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
急激な変化をデータで見極める データ分析講座(その175)

  ◆ 売上などが急激な変化をしたとき「何が変わり何が変わっていないのか」をデータで見極める  収益の急激な悪化は、時系列解析の用語で言...

  ◆ 売上などが急激な変化をしたとき「何が変わり何が変わっていないのか」をデータで見極める  収益の急激な悪化は、時系列解析の用語で言...


リモートセンシング技術の進歩、そしてドローンへ

  リモートセンシングとは、離れたところから対象物に触れずに、その形状や性質など様々な情報を取得する技術または手法のことをいいます。可視光...

  リモートセンシングとは、離れたところから対象物に触れずに、その形状や性質など様々な情報を取得する技術または手法のことをいいます。可視光...


BPMN、CMMN、DMNとは

   この歳になると、転職などは現実としてあまり考えられないし、ましてや良い転職先などはほとんど見つけられそうもないのですが、それでも定期的に...

   この歳になると、転職などは現実としてあまり考えられないし、ましてや良い転職先などはほとんど見つけられそうもないのですが、それでも定期的に...


「情報マネジメント一般」の活用事例

もっと見る
現場のExcel依存に注意しよう

 マイクロソフトの「Excel」は企業の業務遂行にとって欠かせないツールになりました。数字の集計、グラフの作成にとどまらず、作業伝票の発行、作業の管理、資...

 マイクロソフトの「Excel」は企業の業務遂行にとって欠かせないツールになりました。数字の集計、グラフの作成にとどまらず、作業伝票の発行、作業の管理、資...


個票データの共用化でコストダウン

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...


‐販路開拓に関する問題 第2回‐ 製品・技術開発力強化策の事例(その18)

 販路開拓に関する問題点、次に示す4点について、第1回として、1と2項を解説しました。今回は、第2回として、3と4項を解説します。        1....

 販路開拓に関する問題点、次に示す4点について、第1回として、1と2項を解説しました。今回は、第2回として、3と4項を解説します。        1....