◆ 3つの視点でテーマを考える
【目次】
- 「取得」に関する容易性
- 「分析」に関する容易性
- 「活用」に関する容易性
データサイエンス実践(データ分析・活用)の成否を左右するのは、テーマ選定にあります。理由は単純です。上手くいきそうもないことをいくら頑張っても、上手くいかないからです。例えば、あなたが陸上選手だとします。「3ケ月間のトレーニング期間で100メートル走を5秒で突破する」というテーマを掲げても、恐らく上手くいかないことでしょう。
また、あなたが受験生だとします。模試の結果から「よく間違っている、かつ、点数の伸びしろが大きい設問」を把握し、その設問を「3ケ月間の学習期間で得点源にする」というテーマで取り組めば、恐らく上手くいくことでしょう。
両者の違いは「容易性」(何となくできそう)にあります。今回は「データサイエンス実践の容易性を評価する3つの視点」についてお話します。
1. テーマ選定における2つの評価軸
色々なテーマ選定軸が考えられますが、よく使うのが次の2つの軸です。
- インパクトの大きさ
- 容易性の程度
「インパクトの大きさ」とは、データ分析・活用することによるインパクトの大きさです。ビジネスであれば、売上額やコストダウン額、利益額など金額換算で評価されます。こちらは、多くの場合定量的な評価になります。
「容易性の程度」とは、データ分析・活用を実現するために、どの程度容易か(逆に難しなのか)を評価したものです。こちらは、定性的な評価になります。定性的な評価を一対比較評価などを活用することで、定量化することができます。AHP(Analytic Hierarchy Process、階層分析法)と呼ばれる手法です。
上手くいきやすいテーマとは「インパクトが大きく、かつ、容易なテーマ」です。教育目的でインパクトの大きさを考えないのであれば「容易なテーマ」になります。
2. 容易性を評価する3つの視点
「容易性の程度」とは、データ分析・活用を実現するため、どの程度容易か(逆に難しなのか)を評価したものです。具体的に、何の容易性でしょうか?色々な容易性が考えられますが、よく使うのが次の3つです。
- 「取得」に関する容易性
- 「分析」に関する容易性
- 「活用」に関する容易性
どれか一つでも欠けると、実は容易ではなくなります。それぞれの容易性について説明します。
①「取得」に関する容易性
『取得』に関する容易性とは「データ取得がどれだけ容易か?」を評価したものです。データの所在を確認したら、データそのものが存在しないのであれば、あまり容易でありません。データがなくても、取得が比較的簡単であれば、容易になります。データがあっても、データの状態が非常に汚かったり、データ分析用のデータセットを作るのが大変そうであれば、それは容易とは言えません。「取得」に関する容易性は、データ分析をする人であれば、必ず評価する視点かと思います。
②「分析」に関する容易性
『分析』に関する容易性とは「データの整備や加工、分析、モデル構築などが、どれだけ容易か?」を評価したものです。「分析」に関する容易性は、若干経験値が必要になります。
データ分析のテーマに取り組むのに…
どのような集計が必要か
どのような分析が必要か
どのようなモデル構築が必要か
…について、データ分析に取り組む前のテーマ設定の段階で、ある程度みえていないといけないからです。
データ分析の経験値が不足している人は、テーマ選定の段階ではなく、データ分析をしながら評価することになるかもしれません。とはいえ「分析」に関する容易性は、どこかのタイミングで必ず評価する視点かと思います。
③「活用」に関する容易性
『活用』に関する容易性とは「現場で、実際に活用し成果を得るのが、どれだけ容易か?」を評価したものです。この「現場」とは、データ分析を活用する現場です。経営の現場の場合もあれば、生産現場のケースもあります。営業の現場のこともあれば、経理の現場の場合もあります。残念ながら「活用」に関する容易性の評価は、サボられがちです。
『活用』に関する容易性は、3つの評価の中で一番重要です。なぜなら、活用されなければ、そのデータ分析・活用の取り組みは、当然上手くいきません。活用されないのですから、当然といえば当然ですが、現場で活用しやすいかどうかの視点が、テーマ設定時で抜けているケースが結構あります。
この『活用』に関する容易性の評価は、活用する現場の意見が無いことには評価不可能です。現場の「やりたい」、「やれそう」、「イメージが付く」、「こうしてもらえればできる」などが必要になります。現場から「やりたくない」、「できなさそう」、「イメージが付かない」などの意見が出たら、まずデータ分析・活用は実現されません。
テーマ選定の段階で…
このような現場の意見を取り入れていない、
聞きに行っていない、
そもそも接触していない、
…といった状況の場合、データ分析・活用がギャンブルになってしまいます。やるかやらないかは「現場まかせ」となるからです。
3. 今回のまとめ
今回は「データサイエンス実践の容易性を評価する3つの視点」というお話しをしました。データサイエンス実践の成否を左右するのはテーマ選定にあります。色々なテ...