◆ 小さくデータサイエンスを始めるならPPDACサイクル
データとドメイン(営業・マーケティング・生産・経営などの現場)を結びつけ、データサイエンスで成果を出したい場合、小さく始め大きく波及させるのが定石です。いきなり大きく始めようとするとなかなか上手く進みません。ということで「小さく始めよう!」となっても、思うように進められないかもしれません。例えば小さく始めるためのテーマ設定でつまずくかもしれません。データ活用には個々の問題をデータ活用で解決するものと、日常的なデータドリブンな状態を作るものがあります。
個々の問題をデータ活用で解決するための分析マネジメントフレームワークに、PPDACというものがあります。最終的な目的が「日常的なデータドリブンな状態を作る」ことでも、最初はPPDACサイクルを使うと上手くいきます。今回は「小さくデータサイエンスを始めるならPPDACサイクル」というお話しをします。
1、PPDACサイクルとは
PPDACサイクルとは、1990年代に作られた問題解決のための分析マネジメントサイクルで、次の5つからなります。
- P(Problem、課題設定)
- P(Plan、計画)
- D(Data、データ収集)
- A(Analysis、分析)
- C(Conclusion、とりあえずの結論)
このサイクルの優れているところは、実用的で誰でも使えることです。小中学生がデータ分析を活用した問題解決力を身につけるための授業などでも使われています。
2、とりあえずの結論
PPDACサイクルは慎重に1度回すというよりも、気軽に高速にたくさん回します。PPDACサイクルを1回転するたびに「とりあえずの結論(Conclusion)」を出し、結論を都度修正していきます。この「とりあえずの結論」は関係者でレビューし、必要があれば何度でもPPDACサイクルを回していきます。PPDACサイクルそのものに興味のある方は「拙著(2015)『ロジカルデータ分析』 日経BP」を読んでいただければと思います。
3、問題は「どのテーマを選ぶか」
小さくデータサイエンスを始めるにしても、問題は「どのテーマを選ぶのか」になるかと思います。例えば次のようなアプローチ方法があります。
ステップ1: とりあえずのテーマの設定
- ステップ1-1: 抱えている問題(困りごと)をもとにテーマ候補の洗い出し
- ステップ1-2: テーマ候補に対し今あるデータから何ができそうか検討
- ステップ1-3: テスト的に実務でトライアルできそうなテーマの決定
ステップ2: テーマの今後の取り扱いの検討
- ステップ2-1: テスト的に実務でトライアル
- ステップ2-2: テーマの取り扱いの検討
- ステップ2-3: 小さく始めるテーマの決定
4、2つのPPDACサイクル
このアプローチの場合、例えば以下の2つのPPDACサイクルを回すことになります。
- 「ステップ1:とりあえずのテーマの設定」のためのPPDACサイクル
- 「ステップ2:テーマの今後の取り扱いの検討」のためのPPDACサイクル
次に簡単に説明します。
(1) 「ステップ1:とりあえずのテーマの設定」のためのPPDACサイクル
P(Problem、課題設定)
現場で抱えている問題(困りごと)から洗い出したテーマ候補の中から、筋のよさそうなテーマを課題として設定します。
- As-Is(現状)アプローチとTo-Be(理想)の2つのアプローチがあります
- As-Is(現状)アプローチとは先ず現状の困りごとを洗い出し、洗い出した困りごとに対して理想の状態を想像し問題点(As-IsとTo-Beのギャップ)を出していく方法です
- To-Be(理想)アプローチは先ず理想の状態を定義し、理想と大きくかけ離れた現状から問題点(As-IsとTo-Beのギャップ)を出していくやりかたです
- 問題点(As-IsとTo-Beのギャップ)から、筋のよさそうなテーマ(例:やり易く成果の大きそう)を課題として設定します。
P(Plan、計画)
筋のよさそうなテーマ(例:やり易く成果の大きそう)に対し、D(Data、データ収集)からA(Analysis、分析)、C(Conclusion、とりあえずの結論)までの計画を立てます。今回のD(Data、データ収集)からA(Analysis、分析)、C(Conclusion、とりあえずの結論)までの計画だけでなく、データサイエンスが上手く運用に乗った状態(データドリブン営業やデータドリブンマーケティングなど)の、分析ストーリーや活用ストーリーといったその先のことまで計画します。さらに荒くてもいいので、テスト的な実務トライアルをする場合の計画もしておきます。
D(Data、データ収集)
テーマの課題解決に役立ちそうなデータを集め準備します。場合によっては、現場にしかデータが無かったり(例:担当者のPCや現場のサーバーにしかない)、他社にお願いするケースも出てきます。さらに、今回の分析のために、簡易的にデータ収集を新たに実施する必要もでてきます。
A(Analysis、分析)
テーマとして成り立ちそうかを検討するために、集めたデータに対し、データ分析や数理モデル構築などを実施します。想像とは異なる発見が色々でてきます。
C(Conclusion、とりあえずの結論)
データ分析や数理モデル構築した結果をもとに、現状のデータで何ができそうか、どのようなデータがあれば良さそうか、必要なデータはすぐに集めることができそうか、などを検討します。結論の例としては、テスト的に実務でトライアルできそうなテーマである、データがもう少し溜まってから検討し直す、新たに筋のよさそうなテーマが発見された、などです。