【この連載の前回:データ分析講座(その223)数値予測は9つのシナリオで実施するへのリンク】
データアナリティクス(データ分析)には、次のような種類があります。
- Descriptive Analytics:記述的分析(過去から現在、どうだった)
- Diagnostic Analytics:診断的分析(過去から現在、何が起こった)
- Predictive Analytics:予測的分析(現在から未来、どうなる)
- Prescriptive Analytics:処方的分析(今とるべきアクション)
- Cognitive Analytics:上記4つの自動化・AI化
簡単にまとめると……
- 過去を適切に捉え
- 未来を見通し
- 今すべきことを知る
……という感じです。
データ分析などをするとき、どのデータアナリティクスなのかを認識しておくことは重要です。何よりも、この順番で実施していきます。例えば、今とるべきアクションをデータから導き出したいのに、その前の「記述的分析」「診断的分析」「予測的分析」を実施していないと、無理があるということです。今回は、「5つのデータ分析」というお話しをします。
【目次】
1.Descriptive Analytics:記述的分析 (過去から現在、どうだった)
2.Diagnostic Analytics:診断的分析 (過去から現在、何が起こった)
3.Predictive Analytics:予測的分析 (現在から未来、どうなる)
4.Prescriptive Analytics:処方的分析 (今とるべきアクション)
5.Cognitive Analytics: 上記4つの自動化・AI化
1.Descriptive Analytics:記述的分析(過去から現在、どうだった)
記述的分析(Descriptive Analytics)とは、一般的に言われている「見える化」です。EDA(探索的データ分析)の一部でもあり、モニタリングでもあります。過去のデータを集計したり分析したりグラフ化したりし、何か問題が起こっていないだろうか、何かシグナルが出ていないだろうかと分析するものです。
データを手に入れたとき、そのデータを理解するために実施したりするのも、この記述的分析(Descriptive Analytics)になります。EDA(探索的データ分析)と言われています。例えば、データセットの各変数の平均値や分散などの記述統計量を計算したり、各変数の分布を集計してみたり、それらをグラフ化したりし眺めたりします。
冒頭で触れましたが、決められた指標(データを集計したモノ)をモニタリングするのも、記述的分析(Descriptive Analytics)です。この場合に活躍するのが「異常検知」です。
売上や契約件数、サイトなどのPV(ページビュー)数や問い合わせ件数、CV(コンバージョン)数などの指標が、想定通りか? 問題は起こっていないだろうか? などをモニタリングしながら「異常検知」します。
2.Diagnostic Analytics:診断的分析(過去から現在、何が起こった)
診断的分析(Diagnostic Analytics)とは何でしょうか?もっと分かりやすいワードで表現すると「要因分析」です。記述的分析(Descriptive Analytics)を実施したとき、「なぜ?」と気になることが出てきます。その「なぜ?」を探るのが診断的分析(Diagnostic Analytics)です。
記述的分析(Descriptive Analytics)で触れたEDA(探索的データ分析)という観点でお話しすると、記述的分析(Descriptive Analytics)と共に診断的分析(Diagnostic Analytics)も、データ理解のためにEDA(探索的データ分析)の1部分として実施することも多いです。
記述的分析(Descriptive Analytics)で触れたモニタリングという観点でお話しすると、モニタリング時に「異常検知」を実施し、異常と判断されたら次に診断的分析(Diagnostic Analytics)である「要因分析」を実施します。
通常、データだけでは過去の状況は把握できないので、人的な洞察力がものを言います。データは、洞察力を助けるツールに過ぎません。
3.Predictive Analytics:予測的分析(現在から未来、どうなる)
予測的分析(Predictive Analytics)とは、予測モデルを構築し、将来予測を実施しながら未来を分析するということです。シミュレーションも含まれます。予測モデルは、過去の傾向やパターンなどに基づいて構築されます。
予測モデルを作るとき、過去の傾向やパターンなどを分析するために、EDA(探索的データ分析)を実施します。要は、先にあげた記述的分析(Descriptive Analytics)や診断的分析(Diagnostic Analytics)を実施します。
EDA(探索的データ分析)を実施することで、効果的な特徴量(予測モデルの説明変数X)を構築することができます。ちなみに、予測的分析(Predictive Analytics)は、単にデータだけでどうにかなるものではありません。なぜならば、未来を分析するからです。
例えば、予測モデルを使うにしても、幾つかの前提(シナリオ)を置いて実施することになると思います。
4.Prescriptive Analytics:処方的分析(今とるべきアクション)
処方的分析(Prescriptive Analytics)とは、意思決定を促し今とるべきアクションを導き出すものです。今まで説明した記述的分析(Descriptive Analytics)・診断的分析(Diagnostic Analytics)・予測的分析(Predictive Analytics)を踏まえて実施します。
端的にレコメンドモデルなどを構築するのもいいでしょう。レコメンドモデルとは、例えば経路検索や商品のおすすめなどを実施する、数理モデルのことです。現実的には、レコメンドモデルが指し示すアクションを妄信することなく、諸事情を考慮し意思決定し、今とるべきアクションを検討することでしょう。
なぜならば、データは所詮過去の一部分の記録に過ぎず、そもそも未来...