リスク少なく物事を上手く運ぶには データ分析講座(その130)

更新日

投稿日

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 ...

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 要するに先ずは「やってみなはれの精神で、やってみる」そして「溜まったデータで石橋を叩きながら渡る」といった感じです。このサイクルが上手く回りだすと、どんどんいい方向にいくことでしょう。

5、データ分析:今回のまとめ

 今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをしました。実は、データ活用をするということは「石橋を叩いて渡る」ようなものだからです。なぜでしょうか。データを上手く活用することで、リスクを減らすことができるからです。一体どのように? と感じる方もいることでしょう。例えば、統計モデルを上手く構築することで、リスクを減らすことができます。来月の売上の予測値の確度を上げることができる、ということです。この時、営業訪問などのアクションとの紐づけができると嬉しいことでしょう。

 例えば、法人営業の訪問回数を昨年に比べ1.2倍に増やすと売上が10%高くなる、といったことです。もちろん、アクションに対する生産性や効率性、コストパフォーマンスなどを考慮する必要はあります。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データ活用の成否を握るのは周辺人 データ分析講座(その295)

  組織の中の方に染まってしまうほど、物事は進め難くなるようです。生存本能的に、その組織の崩壊を防ぐことが自身の崩壊を防ぐのではないかと、...

  組織の中の方に染まってしまうほど、物事は進め難くなるようです。生存本能的に、その組織の崩壊を防ぐことが自身の崩壊を防ぐのではないかと、...


AIによるデータ分析、「拡張分析」とは:データ分析講座(その316)

  数年前から拡張分析(Augmented Analytics)の時代が来ると叫ばれていました。拡張分析(Augmented Analyt...

  数年前から拡張分析(Augmented Analytics)の時代が来ると叫ばれていました。拡張分析(Augmented Analyt...


PDCAサイクルとOODAループ データ分析講座(その27)

◆ データ活用の現場を躍動させるOODAループ  営業やマーケティングなどでデータ活用をするとき、PDCA(Plan-Do-Check-Act、計画...

◆ データ活用の現場を躍動させるOODAループ  営業やマーケティングなどでデータ活用をするとき、PDCA(Plan-Do-Check-Act、計画...


「情報マネジメント一般」の活用事例

もっと見る
中小企業のセキュリティ対策を考える

◆ 企業の情報セキュリティと新型コロナウィルス対策の今  先日、駅のプラットフォ-ムで並んでいる時に、控えめに咳をしたら、前に並んでいた人にすかさず...

◆ 企業の情報セキュリティと新型コロナウィルス対策の今  先日、駅のプラットフォ-ムで並んでいる時に、控えめに咳をしたら、前に並んでいた人にすかさず...


ソーシャルメディアデータの解析事例:異分野研究から得られる共通した目的とは

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...


P値で行う統計リテラシー判定

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...

 「ピーチ」って聞いたら何を連想しますか、統計を学んでいる人に取っては「 P値 」が思い浮かぶはずです。統計学の素養がある程度備わっているか一言で知ろうと...