【この連載の前回:データ分析講座(その223)数値予測は9つのシナリオで実施するへのリンク】
データアナリティクス(データ分析)には、次のような種類があります。
- Descriptive Analytics:記述的分析(過去から現在、どうだった)
- Diagnostic Analytics:診断的分析(過去から現在、何が起こった)
- Predictive Analytics:予測的分析(現在から未来、どうなる)
- Prescriptive Analytics:処方的分析(今とるべきアクション)
- Cognitive Analytics:上記4つの自動化・AI化
簡単にまとめると……
- 過去を適切に捉え
- 未来を見通し
- 今すべきことを知る
……という感じです。
データ分析などをするとき、どのデータアナリティクスなのかを認識しておくことは重要です。何よりも、この順番で実施していきます。例えば、今とるべきアクションをデータから導き出したいのに、その前の「記述的分析」「診断的分析」「予測的分析」を実施していないと、無理があるということです。今回は、「5つのデータ分析」というお話しをします。
【目次】
1.Descriptive Analytics:記述的分析 (過去から現在、どうだった)
2.Diagnostic Analytics:診断的分析 (過去から現在、何が起こった)
3.Predictive Analytics:予測的分析 (現在から未来、どうなる)
4.Prescriptive Analytics:処方的分析 (今とるべきアクション)
5.Cognitive Analytics: 上記4つの自動化・AI化
1.Descriptive Analytics:記述的分析(過去から現在、どうだった)
記述的分析(Descriptive Analytics)とは、一般的に言われている「見える化」です。EDA(探索的データ分析)の一部でもあり、モニタリングでもあります。過去のデータを集計したり分析したりグラフ化したりし、何か問題が起こっていないだろうか、何かシグナルが出ていないだろうかと分析するものです。
データを手に入れたとき、そのデータを理解するために実施したりするのも、この記述的分析(Descriptive Analytics)になります。EDA(探索的データ分析)と言われています。例えば、データセットの各変数の平均値や分散などの記述統計量を計算したり、各変数の分布を集計してみたり、それらをグラフ化したりし眺めたりします。
冒頭で触れましたが、決められた指標(データを集計したモノ)をモニタリングするのも、記述的分析(Descriptive Analytics)です。この場合に活躍するのが「異常検知」です。
売上や契約件数、サイトなどのPV(ページビュー)数や問い合わせ件数、CV(コンバージョン)数などの指標が、想定通りか? 問題は起こっていないだろうか? などをモニタリングしながら「異常検知」します。
2.Diagnostic Analytics:診断的分析(過去から現在、何が起こった)
診断的分析(Diagnostic Analytics)とは何でしょうか?もっと分かりやすいワードで表現すると「要因分析」です。記述的分析(Descriptive Analytics)を実施したとき、「なぜ?」と気になることが出てきます。その「なぜ?」を探るのが診断的分析(Diagnostic Analytics)です。
記述的分析(Descriptive Analytics)で触れたEDA(探索的データ分析)という観点でお話しすると、記述的分析(Descriptive Analytics)と共に診断的分析(Diagnostic Analytics)も、データ理解のためにEDA(探索的データ分析)の1部分として実施することも多いです。
記述的分析(Descriptive Analytics)で触れたモニタリングという観点でお話しすると、モニタリング時に「異常検知」を実施し、異常と判断されたら次に診断的分析(Diagnostic Analytics)である「要因分析」を実施します。
通常、データだけでは過去の状況は把握できないので、人的な洞察力がものを言います。データは、洞察力を助けるツールに過ぎません。
3.Predictive Analytics:予測的分析(現在から未来、どうなる)
予測的分析(Predictive Analytics)とは、予測モデルを構築し、将来予測を実施しながら未来を分析するということです。シミュレーションも含まれます。予測モデルは、過去の傾向やパターンなどに基づいて構築されます。
予測モデルを作るとき、過去の傾向やパターンなどを分析するために、EDA(探索的データ分析)を実施します。要は、先にあげた記述的分析(Descriptive Analytics)や診断的分析(Diagnostic Analytics)を実施します。
EDA(探索的データ分析)を実施することで、効果的な特徴量(予測モデルの説明変数X)を構築することができます。ちなみに、予測的分析(Predictive Analytics)は、単にデータだけでどうにかなるものではありません。なぜならば、未来を分析するからです。
例えば、予測モデルを使うにしても、幾つかの前提(シナリオ)を置いて実施することになると思います。
4.Prescriptive Analytics:処方的分析(今とるべきアクション)
処方的分析(Prescriptive Analytics)とは、意思決定を促し今とるべきアクションを導き出すものです。今まで説明した記述的分析(Descriptive Analytics)・診断的分析(Diagnostic Analytics)・予測的分析(Predictive Analytics)を踏まえて実施します。
端的にレコメンドモデルなどを構築するのもいいでしょう。レコメンドモデルとは、例えば経路検索や商品のおすすめなどを実施する、数理モデルのことです。現実的には、レコメンドモデルが指し示すアクションを妄信することなく、諸事情を考慮し意思決定し、今とるべきアクションを検討することでしょう。
なぜならば、データは所詮過去の一部分の記録に過ぎず、そもそも未来...
5.Cognitive Analytics:上記4つの自動化・AI化
Cognitive Analyticsを、どのように訳すれば迷いますが、単にコグニティブ・アナリティクスとしてもいいかもしれません(そのままコグニティブと表現しているIT系の企業が多い気がします)。今流行のワードで表現すれば、AI(人工知能)化です。深層学習(ディープラーニング)をはじめとした機械学習技術やデータサイエンス技術などを組み合わせ、特定のタスクを実行するものです。
例えば、得られたデータ(数値であったり画像であったり文字であったり音声であったり)を処理し数値化し、その数値化したデータに対し異常検知を実施し、異常が起こればその要因を分析し特定し、異常が起こらなければ起こっていないと判断し、それらを踏まえた上で幾つかのシナリオで将来予測つまりシミュレーションを行い、今何をすべきを導き出したりします。
さらに、個々の数理モデルは、新たなデータが得られるたびに再学習し進化していきます。人が関われば人と発生したデータの相互作用から学習し、機械が関われば機械と発生したデータの相互作用から学習するという感じです。