◆ データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない
モデルと聞くと何を思い浮かべるでしょうか。データサイエンスなどに馴染みのある方であれば、予測モデルや異常検知などの数理モデルなどを思い浮かべることでしょう。データサイエンスを実践する時、つまりデータ分析を実務で活用する際は予測モデルや異常検知などの数理モデル以外のモデルも必要になります。今回は「データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない」というお話しをします。
1、モデル
データサイエンスなどに馴染みのない方であれば、ファッションモデルやプラモデルを思い浮かべる人も多いと思います。他にもデータモデルやビジネスモデル、プロセスモデルなど、モデルと名の付くものが世の中には多々あります。
(1) モデルの辞書的な意味
辞書を引いてみるとモデルの意味は、次のようになっています。
- 模範、手本または標準となるもの。また、今後の範とするために試みられたもの。
- 模型、また、展示用の見本。
- ある事象について、諸要素とそれら相互の関係を定式化して表したもの。
- 美術家・写真家が制作の対象とする人や物。
- 小説・戯曲などの題材となった実在の人や事件。
- 機械・自動車などの型式。型。 引用元:デジタル大辞泉
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
- 自動車や機械などの型式。
- 模型。
- 商品や事柄の標準となるもの。模範。手本。見本。
- 画家・彫刻家・写真家などが、製作のとき対象として使う人物。
- 小説・戯曲などに描かれる人物の素材になった実在の人。
- 問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの。 引用元:大辞林 第三版
(2) データサイエンス実践(ビジネス活用)的なモデルの定義
データサイエンスを実践する時、つまりデータ分析を実務で活用するときのモデルはデジタル大辞泉であれば:ある事象について、諸要素とそれら相互の関係を定式化して表したもの。大辞林 第三版であれば:問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの。に近いのです。
個人的には、以下の定義が一番しっくりきます。
モデルとはある人間にとってのある状況、あるいは状況についての概念(idea) の明示的な解釈(explicit interpretation) である。モデルは数式、記号、あるいは言葉で表すことができるが本質的には、実体、プロセス、属性、およびそれらの関係についての記述(description)である。
引用元:Brian Wilson 著・根来 竜之監訳「システム仕様の分析学―ソフトシステム方法論― 」共立出版(1996年1月)
私なりに表現すると「モデルとは現実世界を模したもので、何かしらの記号(数式や図など)で表現されたもの」となります。
ポイントは現実世界を模したもの、記号(数式や図など)で表現されたものです。
2、数理モデル
例えば、統計解析や機械学習などで登場する数理モデルは、数式という記号でモデルを表現しています。数式で表現された数理モデルは、あくまでも現実世界を模したもので、本物ではありません。したがって「数理モデルとは、現実世界を模したもので、数式という記号で表現されたもの」となります。
(1) 数理モデル以外のモデルには何があるのか
データサイエンス実践(ビジネス活用)という立ち位置で考えると、数理モデル以外にも必要となるモデルがあります。例えばプロセスモデル(分析プロセスや活用プロセスなど)、モックアップ(レポートやダッシュボードの雛形)、データモデル(DBの雛形)、ビジネスモデル(収益を上げるための仕組みなど)あたりでしょうか。共通しているのは表現する時に数式化や図式化したり、何かしらの記号で表現することでしょう。当然ですが、現実世界そのものではなく、あくまでも現実世界を単純化し模倣したものです。
(2) 2種類のモデル
モデルには大きく2種類あります。
- 今現在の現実世界を表現した「As-Isモデル」(典型モデルや近似モデル)
- こうあるべき現実世界を表現した「To-Beモデル」(理想モデルや規範モデル)
例えば今現在の業務フローを図示化すれば、それは「As-Isモデル」型のプロセスモデルで、あるべき業務フローを図示化すれ...