最近多いケーススタディ③「お勧め商材のレコメンド」 データ分析講座(その190)

更新日

投稿日

 

 

データを使い販売力を効率的に高めるセールスアナリティクスには、3つの典型的なテーマがあります。

  • 新規顧客の獲得
  • 既存顧客の離反阻止
  • 既存顧客の取引額拡大

もしくは、3つを区別せず「売上」や「利益」、「コスト」という感じで合算して数字を分析する感じになるかもしれません。そういう意味では、典型的なテーマは3つではなく4つと言えるかもしれません。その中で、最近多いケーススタディを何回かに分けて紹介していきます。今回は、「お勧め商材のレコメンド(クロスセル、アップセルなど)」のお話しをします。

【目次】

1.ECサイトでお馴染みの「お勧め商材のレコメンド」
(1)レコメンド(情報推奨/推薦)のためのデータ分析
2.古典的な3つのレコメンドのやり方
(1)シミュレーションによる試行錯誤
(2)数理最適化モデル
(3)レコメンドモデル

 

1.ECサイトでお馴染みの「お勧め商材のレコメンド」

ECサイトでお馴染みの「お勧め商材のレコメンド」(クロスセル、アップセルなど)が、法人向けにビジネスをしている企業で最近活用され始めています。3つの典型的なテーマの中の「既存顧客の取引額拡大」のデータ分析・活用に該当します。このデータ分析・活用は、商材が複数あることが条件となります。

商材とは、メイン商材だけでなくオプション商材(メイン商材に付随するサービスなど)でも構いません。

 

(1)レコメンド(情報推奨/推薦)のためのデータ分析

レコメンドのためのデータ分析といっても色々あります。よくあるのは次の2つです。

 

  • 【都度データ分析】重要な意思決定をサポートする情報を、データサイエンティストやデータ分析担当者などが依頼のたびにアドホックにデータを分析し提供する
  • 【数理モデル構築】レコメンド・システムを構築し機械的に情報を提供するために、データを分析しレコメンドのため数理モデルを構築する

 

前者は、昔からあるデータ分析・活用です。データサイエンティストやデータ分析担当者などのデータを分析する側の、データに現れない情報を取り込み洞察する力量が大きく問われるものです。後者は、レコメンドのための数理モデルを構築するため、将来を予測する数理モデルを構築するときと同様に、汎用性や解釈性など気を付けるべきポイントを踏まえ構築する必要があります。

 

また、使ってみなければ善し悪しの判断がつかないため、通常は複数のレコメンドのための数理モデルを構築し実際に使いながら取捨選択したり、実運用しながら数理モデルを都度改良し続けたりするなどが必要になります。実践時には、地味に計算スピードの問題が大きくのしかかることがあります。

 

2.古典的な3つのレコメンドのやり方

ここで、古典的な3つのレコメンドのやり方について簡単に説明します。

  • シミュレーションによる試行錯誤
  • 数理最適化モデル
  • レコメンドモデル

 

(1)シミュレーションによる試行錯誤

「シミュレーションによる試行錯誤」とは、構築した予測モデルを使い、シミュレーションを実施することで、最適なアクションを探ろうというアプローチです。「X(説明変数)を変化させたときにY(説明変数)がどうなるのか?」をシミュレーションしながら、実施すべき施策を検討します。

 

データ分析

 

回帰分析を実施し予測モデルを構築するとき、直近の傾向を取り込み反映するために、新しいデータが発生した都度に回帰分析を実施し予測モデルを学習し求めたり(例:毎日予測モデルを再学習する)、直近のデータほど重要視した回帰分析(例:直近のデータほど大きな重みを付ける)を実施し予測モデルを学習し求めたりします。

 

このように予測モデルを構築することで、今までと違う傾向が発生した場合(例:自然災害などの不測の事態)に時代にアジャストした予測モデルにすることができます。

 

(2)数理最適化モデル

「数理最適化モデル」とは、数理計画法というアルゴリズムを使って、最適解を数理的に求めるアプローチです。「シミュレーションによる試行錯誤」のような試行錯誤をせずに求めるのが特徴です。

 

データ分析

 

例えば、マーケティングの広告・販促であればmROI(Marketing Return On Investment)を最大化する広告・販促費の最適配分を求めるであるとか、小売店の棚割り系であれば利益最大化する最適棚割りを求めるであるとか、開発・生産系であれば一定基準以上の品質特性(通常Yは1変量ではなく多変量)を実現するための最適な設計条件を求めるであるとか、調達・発注系であれば利益最大化する最適発注量を求めるであるとか、目的変数Yを最大化もしくは最小化するための説明変数Xを算出します。

 

数理計画法(線形計画法・非線形計画法・混合整数計画法など)のモデリング技術(事象の数式化)はそれなりのスキルが必要なため、ツールがあればできるというものではありませんが、非常に強力な手段の1つです。

 

数理計画法を活用したレコメンドをする場合、回帰分析をダイレクトに活用するというよりも、回帰分析の結果をもとに数理計画法の中で利用する数式を求める、ということをすることが多いです。この数理計画法に馴染みの薄い人も多いかと思います。

 

数理計画法で解くための問題を「いかに定式化するのか」(モデリング)、それを「いかに解くのか」という大きな2つの問題にぶち当たります。意外と厄介なのが「いかに定式化するのか」(モデリング)で、対象となる現象を定式化することが不慣れな方が多い印象があります。若干、定式化のテクニックが必要になります。「いかに解くのか」もそれなりに厄介です。

 

数理計画法の中でも非線形計画法や混合整数計画法の範疇になると、厳密解(専門用語でいうと大域的最適解)を求めようとすると膨大な計算時間が必要となり実務活用できないケースもあります。そのため、妥協解(専門用語でいうと局所的最適解の中で実務上受け入れ可能な解)を求めるシステムにすることが多いです。多くの場合、解をだすためのコンピュータの計算速度と、求めた妥協解の厳密解からの乖離度合いで評価したりします。

 

例えば、厳密解を求めるのに10日前後必要だが、厳密解からの乖離が10%以内の妥協解なら計算時間1分以内に出せる、などです。

 

(3)レコメンドモデル

「レコメンドモデル」とは、協調フィルタリングなどのレコメンド用の数理モデルを使い、実施すべきアクションを求めるアプローチです。...

 

 

データを使い販売力を効率的に高めるセールスアナリティクスには、3つの典型的なテーマがあります。

  • 新規顧客の獲得
  • 既存顧客の離反阻止
  • 既存顧客の取引額拡大

もしくは、3つを区別せず「売上」や「利益」、「コスト」という感じで合算して数字を分析する感じになるかもしれません。そういう意味では、典型的なテーマは3つではなく4つと言えるかもしれません。その中で、最近多いケーススタディを何回かに分けて紹介していきます。今回は、「お勧め商材のレコメンド(クロスセル、アップセルなど)」のお話しをします。

【目次】

1.ECサイトでお馴染みの「お勧め商材のレコメンド」
(1)レコメンド(情報推奨/推薦)のためのデータ分析
2.古典的な3つのレコメンドのやり方
(1)シミュレーションによる試行錯誤
(2)数理最適化モデル
(3)レコメンドモデル

 

1.ECサイトでお馴染みの「お勧め商材のレコメンド」

ECサイトでお馴染みの「お勧め商材のレコメンド」(クロスセル、アップセルなど)が、法人向けにビジネスをしている企業で最近活用され始めています。3つの典型的なテーマの中の「既存顧客の取引額拡大」のデータ分析・活用に該当します。このデータ分析・活用は、商材が複数あることが条件となります。

商材とは、メイン商材だけでなくオプション商材(メイン商材に付随するサービスなど)でも構いません。

 

(1)レコメンド(情報推奨/推薦)のためのデータ分析

レコメンドのためのデータ分析といっても色々あります。よくあるのは次の2つです。

 

  • 【都度データ分析】重要な意思決定をサポートする情報を、データサイエンティストやデータ分析担当者などが依頼のたびにアドホックにデータを分析し提供する
  • 【数理モデル構築】レコメンド・システムを構築し機械的に情報を提供するために、データを分析しレコメンドのため数理モデルを構築する

 

前者は、昔からあるデータ分析・活用です。データサイエンティストやデータ分析担当者などのデータを分析する側の、データに現れない情報を取り込み洞察する力量が大きく問われるものです。後者は、レコメンドのための数理モデルを構築するため、将来を予測する数理モデルを構築するときと同様に、汎用性や解釈性など気を付けるべきポイントを踏まえ構築する必要があります。

 

また、使ってみなければ善し悪しの判断がつかないため、通常は複数のレコメンドのための数理モデルを構築し実際に使いながら取捨選択したり、実運用しながら数理モデルを都度改良し続けたりするなどが必要になります。実践時には、地味に計算スピードの問題が大きくのしかかることがあります。

 

2.古典的な3つのレコメンドのやり方

ここで、古典的な3つのレコメンドのやり方について簡単に説明します。

  • シミュレーションによる試行錯誤
  • 数理最適化モデル
  • レコメンドモデル

 

(1)シミュレーションによる試行錯誤

「シミュレーションによる試行錯誤」とは、構築した予測モデルを使い、シミュレーションを実施することで、最適なアクションを探ろうというアプローチです。「X(説明変数)を変化させたときにY(説明変数)がどうなるのか?」をシミュレーションしながら、実施すべき施策を検討します。

 

データ分析

 

回帰分析を実施し予測モデルを構築するとき、直近の傾向を取り込み反映するために、新しいデータが発生した都度に回帰分析を実施し予測モデルを学習し求めたり(例:毎日予測モデルを再学習する)、直近のデータほど重要視した回帰分析(例:直近のデータほど大きな重みを付ける)を実施し予測モデルを学習し求めたりします。

 

このように予測モデルを構築することで、今までと違う傾向が発生した場合(例:自然災害などの不測の事態)に時代にアジャストした予測モデルにすることができます。

 

(2)数理最適化モデル

「数理最適化モデル」とは、数理計画法というアルゴリズムを使って、最適解を数理的に求めるアプローチです。「シミュレーションによる試行錯誤」のような試行錯誤をせずに求めるのが特徴です。

 

データ分析

 

例えば、マーケティングの広告・販促であればmROI(Marketing Return On Investment)を最大化する広告・販促費の最適配分を求めるであるとか、小売店の棚割り系であれば利益最大化する最適棚割りを求めるであるとか、開発・生産系であれば一定基準以上の品質特性(通常Yは1変量ではなく多変量)を実現するための最適な設計条件を求めるであるとか、調達・発注系であれば利益最大化する最適発注量を求めるであるとか、目的変数Yを最大化もしくは最小化するための説明変数Xを算出します。

 

数理計画法(線形計画法・非線形計画法・混合整数計画法など)のモデリング技術(事象の数式化)はそれなりのスキルが必要なため、ツールがあればできるというものではありませんが、非常に強力な手段の1つです。

 

数理計画法を活用したレコメンドをする場合、回帰分析をダイレクトに活用するというよりも、回帰分析の結果をもとに数理計画法の中で利用する数式を求める、ということをすることが多いです。この数理計画法に馴染みの薄い人も多いかと思います。

 

数理計画法で解くための問題を「いかに定式化するのか」(モデリング)、それを「いかに解くのか」という大きな2つの問題にぶち当たります。意外と厄介なのが「いかに定式化するのか」(モデリング)で、対象となる現象を定式化することが不慣れな方が多い印象があります。若干、定式化のテクニックが必要になります。「いかに解くのか」もそれなりに厄介です。

 

数理計画法の中でも非線形計画法や混合整数計画法の範疇になると、厳密解(専門用語でいうと大域的最適解)を求めようとすると膨大な計算時間が必要となり実務活用できないケースもあります。そのため、妥協解(専門用語でいうと局所的最適解の中で実務上受け入れ可能な解)を求めるシステムにすることが多いです。多くの場合、解をだすためのコンピュータの計算速度と、求めた妥協解の厳密解からの乖離度合いで評価したりします。

 

例えば、厳密解を求めるのに10日前後必要だが、厳密解からの乖離が10%以内の妥協解なら計算時間1分以内に出せる、などです。

 

(3)レコメンドモデル

「レコメンドモデル」とは、協調フィルタリングなどのレコメンド用の数理モデルを使い、実施すべきアクションを求めるアプローチです。簡単な協調フィルタリングであれば、EXCELだけでも実現可能です。

 

データ分析

データ分析

 

レコメンドモデルには、協調フィルタリング以外にも色々あります。代表的なものは、「内容(Content)ベース型」や「知識(Knowledge)ベース型」などです。内容ベース型では、顧客の特徴と商材の特徴を用いてレコメンドします。ざっくり言うと、「顧客の好みに合致した特徴を持った商材をレコメンドする」という感じです。

 

協調フィルタリングが、顧客と商材の関係性(例:購買)、つまり目的変数Y(例:購買の有無)だけを活用していることから考えると、必要なデータが増えます。知識ベース型には、大きく「制約(Constraint)ベース型」と「ケース(Case)ベース型」があります。制約ベース型は、利用者が提示した要求を制約条件としてレコメンド可能な解を探索し提示します。ケースベース型は、利用者が提示した要求との類似度をベースにレコメンド可能な解を探索し提示します。この2つを混合させてレコメンドモデルを構築することも多いです。

 

例えば、制約ベース型レコメンドモデルでレコメンド候補を絞り込み、絞り込んだレコメンド候補に対しケースベース型で類似度評価し最終的なレコメンドを実施する、などです。

 

次回に続きます。

 

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
SOR理論 データ分析講座(その132)

◆ なぜ見える化しても成果が出ないのか、その解をSOR理論から探る  データを溜めて見える化したのに上手くいかない要因は色々考えられます。その中の一...

◆ なぜ見える化しても成果が出ないのか、その解をSOR理論から探る  データを溜めて見える化したのに上手くいかない要因は色々考えられます。その中の一...


データ不均衡を解消するSMOTE:データ分析講座(その352)

【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! データ不均衡は、医療、金融、ビジネス分析など...

【目次】  ▼さらに深く学ぶなら!「データ分析」に関するセミナーはこちら! データ不均衡は、医療、金融、ビジネス分析など...


データ分析のビジネス成果は金額で データ分析講座(その83)

◆ ビジネス貢献できないデータ分析、ビジネス成果は金額で  ここ10年、次のような合言葉とともにデータ分析者が増えています。 「データがあるか...

◆ ビジネス貢献できないデータ分析、ビジネス成果は金額で  ここ10年、次のような合言葉とともにデータ分析者が増えています。 「データがあるか...


「情報マネジメント一般」の活用事例

もっと見る
たかがWord、されどWord

 マイクロソフトOfficeはどこでも使われているので、ITリテラシーとしてWordを使えることが求められます。『 Wordが使える 』と言っても、そのレ...

 マイクロソフトOfficeはどこでも使われているので、ITリテラシーとしてWordを使えることが求められます。『 Wordが使える 』と言っても、そのレ...


情報、常識の検証を考える

1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...

1、勝ち組と負け組を支配する情報  皆さんがご存じの大手予備校有名講師である林先生が、かつてテレビで「情報」に関して興味深いことをおっしゃっており、...


Web上で試作受注するツールを成功させるポイントとは

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...