機械学習の普及により「予測」という視点の活用が拡大しています。そのことで、ビジネスを構造的に理解し、近未来の手がかりを得ることができます。従来の数理統計学的な手法にも「予測」を可能とする手法は色々ありますが、機械学習の発展により使える手法の選択肢が急激に増えました。ただ、予測モデルの構築の流れや、活用の際のポイントなどはそれほど大きくは変わってはいないかと思います。ということで、今回は「予測モデルは構築も活用も『現場』がキーになる」というお話しをします。
【目次】
1.予測モデル構築の流れ
2.事象理解
3.不足情報認識
4.現場仮展開
5.モデリングは何度も見直そう!
【この連載の前回:データ分析講座(その259)新規拡大、既存奪い取りの判断指標とはへのリンク】
1.予測モデル構築の流れ
次のフローが予測モデル構築の流れです。
事象理解
↓
モデリング
↓
不足情報認識
↓
再モデリング
↓
現場仮展開
↓
再々モデリング
↓
現場展開(デプロイ)
ちなみにモデリングには、必要なデータの収集や、加工などの前処理、モデル設計、モデル構築(学習と検証など)を含めています。
2.事象理解
事象理解とは、予測モデルの対象とするビジネス活動を構造的に理解するということです。
多くの場合、定性的なアプローチ(ヒアリングやロジカルシンキングなど)を取りますが、データが存在するならば、数理統計学的なアプローチも取ります。予測モデルを構築するという視点で考えると、そのビジネス活動を、どの程度モデリングできるのか、そして何がモデリングできないのか、モデリングするときにどのようなデータが必要で、どのようなデータを今現在活用できるのか、を明らかにします。
事象理解で最も重要なのが、その予測モデルを活用する現場の人々の動きが、どのように変化するのか、そしてどのようなメリットとデメリットが発生するのかを、明らかにすることです。誰も求めていない予測モデルや、活用方法の分からない予測値は、当然ながら現場活用されません。
3.不足情報認識
一度モデリングを実施すると、モデリング上の色々な問題が噴出します。想像していたデータが入手できない、入手しても思ったものと違う、などなど。なぜならば、予測モデルの雛形が出来上がることで、より具体的なイメージを持つことができるからです。
そこで初めて、本当に必要なデータが何なのか、現場からどのような予測モデルが求められているのか、予測値を現場へどのタイミングで情報提供し現場はどう動くのか、などを考えるようになります。要は、最初に想像していたものと異なる何かが見えてきます。不足情報を認識するということです。
この過程を挟むことは非常に重要で、より現場活用される可能性の高いモデリングを可能にします。
4.現場仮展開
よいと思った予測モデルが、実際に現場で使ってみたら、あまり活用されないことは、多々あります。
使って初めて分かることを整理し、モデリングに活かすことで、より現場活用される可能性の高いモデリングが実現にします。ちょっとした改善で、あまり活用されない予測モデルが、上手く活用さるようになることもあります。
予測結果を現場に提供するタイミングを変えたり、見せ方を変えたり、粒度を荒くしたり細かくしたり、ちょっとしたことです。
5.モデリングは何度も見直そう
次のフローが予測モデル構築のざっくりした流れです。
事象理解
↓
モデリング
↓
不足情報認識
↓
再モデリング
↓
現場仮展開
↓
再々モデリング
↓
現場展開(デプロイ)
何度もモデリングというキワードが登場しますが、定期的にモデリングし直しましょう。より現場活用される可能性の高い予測モデルを手にする可能性が高まります。
一番良くないのは、最初に考えた予測モデルを、強引に構築し現場活用することです。次に良くないのは、改善のためで...
はなく、改悪のための再モデリングや再々モデリングです。
改悪のための再モデリングや再々モデリングとは、最初に考えた予測モデルを前提とし、想像していたデータが入手できないためとか、入手しても思ったものと違うからとか、最初に考えた予測モデルを前提としたデータの過不足を理由による再モデリングや再々モデリングです。
◆【特集】 連載記事紹介:連載記事のタイトルをまとめて紹介、各タイトルから詳細解説に直リンク!!
◆データ分析講座の注目記事紹介