リスク少なく物事を上手く運ぶには データ分析講座(その130)

更新日

投稿日

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 ...

データ分析

◆ ビジネスにおけるデータサイエンス

 ビジネスにおけるデータサイエンスに対し、みなさんはどのような印象があるでしょうか。人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージを思い浮かべる方もいます。サイエンスという響きが、通常のテクノロジーを凌駕した不思議と最近のAIブームが、魔法っぽさを醸し出しているようです。しかし実状は異なります。今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

1、データ分析:石橋を叩いて渡る

 「石橋を叩いて渡る」ということわざがあります。意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。しかしデータ分析の世界では笑い事ではありません。データ活用をするということは「石橋を叩いて渡る」ようなものだからです。

2、データでリスクを減らす

 なぜデータ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。例えばデータが全くない状態で、明日の来月の売上を予測することは至難の業です。データがあることで、来月の売上に対し、何らかのあたりを付けることができます。例えば昨年同月の売り上げが50億円だったから、来月の売り上げは50億円ぐらいだろう、とか。例えば今月の売り上げは昨年比で10%高いから、来月も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。そういった感じです。

3、データ分析:〇〇をしたら▢▢になる

 アクションと売り上げが紐づいていて「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売り上げが10%高くなった」という関係性が分かるとどうでしょうか。多くの場合さらに嬉しいでしょう。このような関係は、データさえあれば見つけ出すことができます。ちなみに、次のように説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

 つまり、XとYの関係性をデータから見出すということです。この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

4、データ分析:統計モデルなどを思い浮かべると分かりやすい

 統計モデルなどを思い浮かべると分かりやすいでしょう。リスクとは分散(もしくは標準偏差)の大きさを意味するからです。統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろんモデル上のお話しです。統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなってしまうと思いますので簡単に説明します。

(1) 分散とは

 分散とは目的変数 Y(例では売上)のバラつきの大きさのことです。実際にデータの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合では分散は小さくなります。予測する上でこのバラつき(分散)は小さいとほうが嬉しいでしょう。なぜでしょうか。

 来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるか分からない(振れ幅が大きいい)、ということです。例えば「来月の売上は10億円から90億円の間である」といった感じです。そこで過去の売り上げデータや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。例えば「来月の売上は49億円から51億円の間である」といった感じです。

 このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます。

(2) やってみなければデータは溜まらない

 データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。しかし落とし穴があります。「データさえあれば」というところにです。データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。やってみなければデータは溜まらないということです。データサイエンスやデータ分析活用は、データがなければ無力です。

 要するに先ずは「やってみなはれの精神で、やってみる」そして「溜まったデータで石橋を叩きながら渡る」といった感じです。このサイクルが上手く回りだすと、どんどんいい方向にいくことでしょう。

5、データ分析:今回のまとめ

 今回は「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをしました。実は、データ活用をするということは「石橋を叩いて渡る」ようなものだからです。なぜでしょうか。データを上手く活用することで、リスクを減らすことができるからです。一体どのように? と感じる方もいることでしょう。例えば、統計モデルを上手く構築することで、リスクを減らすことができます。来月の売上の予測値の確度を上げることができる、ということです。この時、営業訪問などのアクションとの紐づけができると嬉しいことでしょう。

 例えば、法人営業の訪問回数を昨年に比べ1.2倍に増やすと売上が10%高くなる、といったことです。もちろん、アクションに対する生産性や効率性、コストパフォーマンスなどを考慮する必要はあります。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
「分かっていないこと」(データの裏付けのない「事実」) データ分析講座(その19)

  ◆ 最初に「データで把握すべき最重要なこと」は、「分かっていないこと」を把握すること  「データからどのように読み取り、どのように施...

  ◆ 最初に「データで把握すべき最重要なこと」は、「分かっていないこと」を把握すること  「データからどのように読み取り、どのように施...


AIに奪われるべき仕事を守る日本企業:データ分析講座(その332)

  AI技術の進化により、多くの業務やタスクが自動化され、効率化が進められている国々が増えてきました。だが、日本の一部の企業では、その流れ...

  AI技術の進化により、多くの業務やタスクが自動化され、効率化が進められている国々が増えてきました。だが、日本の一部の企業では、その流れ...


疑われたデータ分析のメリット データ分析講座(その163)

  ◆ “当たり前の結果”で共感を得ることから始めよう  データを使うことに不慣れな組織や人の場合、データから導...

  ◆ “当たり前の結果”で共感を得ることから始めよう  データを使うことに不慣れな組織や人の場合、データから導...


「情報マネジメント一般」の活用事例

もっと見る
‐情報収集で配慮すべき事項(第3回)‐  製品・技術開発力強化策の事例(その11)

 前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...

 前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...


Excelの帳票を見直そう

 オフィス業務においては、マイクロソフトOfficeがデファクトスタンダードになっています。とりわけ活用されているのはExcelでしょう。Excelを使う...

 オフィス業務においては、マイクロソフトOfficeがデファクトスタンダードになっています。とりわけ活用されているのはExcelでしょう。Excelを使う...


‐クレ-ム情報を開発に活用‐  製品・技術開発力強化策の事例(その13)

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...

 前回の事例その12に続いて解説します。顧客から出されたクレ-ムは、技術開発や、関連製品の開発の可能性を潜在させている場合が多いようです。その視点からクレ...