◆ データ分析: 過去を考える
前回のデータ分析講座(その140)データ分析は必ず「アクション」まで導き出す。では次のようなお話しをしました。
データを使い課題解決を考えた時、例えば次の3つをデータから考えていきます。
- ① 何が起こっていたのか(過去)
- ② どうなりそうか(未来)
- ③ 何をすればよいのか(アクション)
データ分析の時、必ず③の「アクション」まで導き出しましょう。そうしないと、単なるデータ分析で終わってしまいます。この順番に、データを分析しながら考えていきます。つまり「何が起こっていたのか(過去)」をまず考える、ということです。
今回は「まずは、何が起こっていたのか(過去)を考える」についてお話しをします。
1、データ分析: 過去のデータで理解
データサイエンスや機械学習などから「予測」というポイントに目が行く方も少なくありません。しかしデータは所詮過去の記録に過ぎません。過去の記録から未来を予測するには、ひと工夫必要になります。
データを使った予測をするために、過去のデータ間の関係性を数理モデル化し、その数理モデルを利用して予測していきます。そういう意味で、過去に「何が起こっていたのか」を、まず考えていくことは、非常に重要になってきます。そもそも、予測するしないに関係なく「まず過去のデータから過去を理解しよう」とする行為は、とても自然なことだと思います。
2、データ分析: 見える化の動機
データを蓄積する動機の一つに、よく「見える化」という言葉が使われます。「見える化」して何をしたいかといえば「何が起こっていたのかを知りたい」ということでしょう。問題が起こっていれば、対策を打つきっかけになりますし、何ごともなければ計画通り進めればいいわけです。そのためデータを手にしたとき、過去に「何が起こっていたのか」を考えていきます。
(1) 事実と解釈
この「何が起こっていたのか(過去)」を考えていくために、次の2つをデータ分析から導き出していきます。
- 事実:データから直接分かることは何か?
- 解釈:データの裏側で何が起こっているのか?
そのために例えば、次のようなデータ分析を実施します。
- モニタリング
- 異常検知
- 要因分析
(2) 例えば、どのようなデータ分析をするのか?
モニタリングでは、得られたデータの状況を加工・集計し、場合によってはグラフなどで視覚化することで、どうなっているのかを見ていきます。次に、その視覚化した数字に異常がないかどうか確認するために、異常検知を実施します。さらに、その異常の原因が何であるかを考えていくため、要因分析を実施します。これらの3つのデータ分析を通して「事実」を把握し、そこから何が起こっていたのかを「解釈」していきます。
(3) 簡単な分析技術でOK
利用する分析技術や数理モデルなどは、それほど高度なものではなく、従来からあるベタなものになります。例えば「QC7つ道具」や「新QC7つ道具」だけで十分分析可能です。可能であれば、統計解析(多変量解析を含む)の知識があると、より良いでしょう。
3、データ分析: 事実は誰が考えてもほぼ同じ
データから分かるのは「ある事象」(例:受注など)の「1面の1部分」だけです。そのため、実際に「何が起こっていたのか」は、データから直接は分かりません。あくまでも、実際に何が起こっていたのかを「知る手掛かり」に過ぎません。そのため、データから「事実」という手掛かりをつかみ、実際に「何が起こっていたのか」を「解釈」する必要があるのです。そして、この「事実」は、誰が考えてもほぼ同じことが導かれます。データを見たまま読み取るからです。
例1:営業マーケティング
例えば……
「先月に比べ受注件数が10%増えた」
「昨年同月に比べ売上が25%落ちた」
「自社開催イベント経由のリード(見込み客)数が、計画値よりも25%多い」
……は誰が見ても同じです。
例2:生産
例えば……
「先週に比べ製品の良品数が50%増えた」
「歩留まり(良品の割合)が87%から58%に悪化した」
「製造ラインの稼働時間が、先月に比べ30%減少した」
……は誰が見ても同じです。
4、データ分析: 解釈は人によって異なる
「事実」では、素直にデータを読み取ります。感情や思い入れ、解釈など主観的な要素は極力排除して読み取ります。「解釈」は「事実」をもとに「何が起こっていたのか」を、その人の持っている情報や今まで培ってきた経験値、感覚などを通して考えるため、人によって異なります。
例3 : 営業マーケティング
例えば「先月に比べ受注件数が10%増えた」に対する「解釈」は……
「受注件数が10%増えたのは『営業が頑張った』からだ」、
「受注件数が10%増えたのは『商材の評判が良くなった』からだ」、
「受注件数が10%増えたのは『リード(見込み顧客)の質が高まった』からだ」
……のように人によって異なります。
例4 : 生産
例えば「歩留まり(良品の割合)が87%から58%に悪化した」に対する「解釈」は……
「歩留まりが58%に悪化したのは『猛暑に対応した機器の温度設定が適切でなかった』からだ」、
「歩留まりが58%に悪化したのは『材料のサプライヤーが変わり材料特性がやや変化した』からだ」、
「歩留まりが58%に悪化したのは『長期休暇明けだった』からだ」
……のように人によって異なります。
5、データ分析: どの解釈が正しいのか
誰のどのような「解釈」が正しいのかは、本当のところ誰も分かりません。
少なくとも「解釈」が現場から見たら「荒唐無稽(こうとうむけい)なこと」にならないように注意しましょう。そのためにも、現場の「解釈」に強く影響させたほうが良いです。近...
多くの場合、現場の頭の中にある「現場感」(感覚的な現場の定性情報)はデータ化されていないので、集めたデータには表れてきません。つまり「解釈」は「事実」と現場の頭の中にある「現場感」(感覚的な現場の定性情報)を掛け合わせることで、実際に「何が起こっていたのか」を垣間見ることです。
6、データ分析: 今回のまとめ
今回は「まずは『何が起こっていたのか(過去)』を考える」というお話しをしました。「何が起こっていたのか」をまずは考えていきます。この「何が起こっていたのか(過去)」を考えていくために、事実:データから直接分かることは何か?解釈:データの裏側で何が起こっているのか?以上2つをデータ分析から導き出していきます。
そのために、例えば次のようなデータ分析を実施します。モニタリング、異常検知、要因分析、データから「事実」を把握し、何が起こっていたのかを「解釈」します。しかし、このままではあくまでも「過去」のことを語ったに過ぎません。そのために、次に「どうなりそうか(未来)」を考えていくことになります。