予測モデルの活用とは データ分析講座(その116)

更新日

投稿日

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論...

情報マネジメント

◆ 予測モデルは帰納的に構築し演繹的に活用する。そして論理展開する。

 データ分析・活用を推し進める時にある段階まで進むと、予測モデルが一つのトピックとして登場します。予測モデルとは数式で表現されたもので例えば受注や受注金額、見込み客からの離脱などを予測するためのものです。当然ながら予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。今回は「予測モデルは帰納的に構築し演繹(えんえき)的に活用する。そして論理展開する」というお話しをします。

1、2つの予測モデルの用途

 セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと次の2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

 「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらの状態になりそうかを予測するものです。受注予測モデルや離脱予測モデルなどです。

一方「どのくらいになりそうかの予測」とは「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。受注金額予測モデルや売上予測モデルなどです。他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

2、帰納法と演繹法

 有名な論理展開の方法に、帰納法と演繹法というものがあります。この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。帰納法とは「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

 例えば色々な哺乳類を調べ、血が流れている事実を積み重ね「哺乳類には血が流れている」という感じで結論付けます。

 演繹法とは「普遍的な事実」から結論を導く推論方法です。

 例えば「ゴリラは哺乳類である」という「普遍的な事実」と「哺乳類には血が流れている」という「普遍的な事実」から「ゴリラには血が流れている」と結論付けます。

3、予測モデルは帰納的に構築

 予測モデルは「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。つまり予測モデルは帰納的に構築されます。しかし実はそうでもありません。例外もあります。ベイズ系のモデルはその典型です。人の主観がモデル構築に多少なりとも影響します。

 そもそもどの種類のモデルを使って予測モデルを構築するのかや、モデル構築する際の学習パラメータ設定など、人が考え設定する必要があります。そういう意味で予測モデル構築は、帰納かつ演繹なのかもしれません。ですが予測モデル構築を大まかに見れば機能的です。

4、予測モデルは演繹的に活用

 予測モデルを活用するときは、そのモデルが正しいものとして活用します。つまり予測モデルは演繹的に活用されます。しかし正しいと思われたモデルが複数あることもあります。どういうことかといいますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。正しいはずの予測値がたくさんあるというおかしな状態です。このような場合、複数の予測値の平均値と計算しそれを予測値としたり複数の予測値で投票し最大得票を予測値とみなしたりします。機械学習用語で表現すると、アンサンブル学習と呼ばれるやり方です。

 「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出すという感じとなり、帰納的な匂いがしてきます。ですが予測モデル活用を大まかに見れば演繹的です。

5、もう一つの論理展開「アブダクション」

 帰納法と演繹法についてお話しましたがが、それだけではありません。もう一つ有名な論理展開があります。それはアブダクションです。

 こちらの論理展開もデータ分析・活用上、非常に重要です。ここでは詳しく説明しませんが、ベイズ統計学の世界と非常に近いようです。アブダクションとは観測事実の生起要因の仮説を作り、論理的に説明するものです。

 現在から過去を探ります。そういう意味で予測とは逆になります。要因分析に近く、データ分析・活用する上で非常に重要です。予測モデルとの合わせ技として予兆検知が挙げられます。未来の異常検知です。未来から現在(もしくは近い未来)を探るのです。未来の異常を予測しその未来の異常を起こす要因を探り対処する、このような使い方です。例えばプレディクティブ・メンテナンス(予知保全)やカスタマーヘルススコア(顧客健全性スコア)などの領域で盛んに活用されています。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
データによる仮説検証の3段階アプローチ データ分析講座(その248)

  仮説を立てて、データで検証する場合、既にある過去データで検証する方法と、これから新たにデータ取得し検証する方法があります。さらに、これ...

  仮説を立てて、データで検証する場合、既にある過去データで検証する方法と、これから新たにデータ取得し検証する方法があります。さらに、これ...


統計的機械学習で使用する混同行列と評価指標 データ分析講座(その296)

  統計的機械学習の世界に、2 値分類問題というものがあります。例えば、受注 or 失注、継続 or 離反、異常 or 正常、死亡 or ...

  統計的機械学習の世界に、2 値分類問題というものがあります。例えば、受注 or 失注、継続 or 離反、異常 or 正常、死亡 or ...


営業を確率で考える データ分析講座(その5)

  ◆ 営業は失注しても、確率で考えれば落ち込めない  「2人の極端な部下がいるけど、どちらも営業成績よくなくて…&hel...

  ◆ 営業は失注しても、確率で考えれば落ち込めない  「2人の極端な部下がいるけど、どちらも営業成績よくなくて…&hel...


「情報マネジメント一般」の活用事例

もっと見る
‐技術開発の目標について 第1回‐  製品・技術開発力強化策の事例(その15)

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...


‐情報収集で配慮すべき事項(第2回)‐  製品・技術開発力強化策の事例(その10)

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...

 前回の事例その9に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明確...


情報システム導入企業の悩みとは

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...

        今回は、次の事例から、自社の生産システムにあった生産管理ソフトの選択をどうすべきかを解説します。   1. 想定事例  電...