◆ 災害予測は難しいが、データを使った災害対応は可能
データを使った災害予測は非常に難しいようです。特に、自然現象が相手となる天災は、データが揃(そろ)わないという理由から、非常に難しいものです。ここ数カ月の新型コロナウイルスがそれに該当することでしょう。例えば、1年前に新型コロナウイルスが猛威を振るうことを予測するのは、難しいということです。しかし今回の天災を含めた災害時の対処において、データ分析・活用(データサイエンス)は非常に有効です。今回は「災害の予測は難しいが、対処ではデータ分析・活用(データサイエンス)が生きる」というお話しをします。
【目次】
1. 全国約2万7000人「発熱続く」 厚労省とLINE調査
(1)有事に扱うデータは「質が悪いもの」~そこは、データ分析者の腕の見せ所
(2)データ分析は、災害時の対処で生きる
2. ベイズ的モデリングとシミュレーション
(1)アパレル店舗の分析例
3. 今回のまとめ
1. 全国約2万7000人「発熱続く」 厚労省とLINE調査
新型コロナウイルス対策のため、厚労省とLINEが共同で行った全国調査(3月末から4月上旬)の集計結果を要約すると次のようになります。
- 4日以上発熱が続いていると答えた人が全体の0.11%(全国で約2万7000人)
- 飲食店や外回りの営業などの職業グループは、発熱を訴える人の割合が平均の2倍の0.23%
- 在宅で家事や育児をする人のグループは、発熱を訴える人の割合が平均の半分以下の0.05%
なぜこのようなデータを集めたのかというと「クラスターの発生を封じ込めるため」という理由からだそうです。クラスターの発生を封じ込めるためには次の2点があります。
- 発生したクラスターを早期に発見する
- 当該クラスターに対して十分な対策を講じる
(1)有事に扱うデータは「質が悪いもの」~そこは、データ分析者の腕の見せ所
このLINE調査のデータは、おそらくデータの質はあまりよろしくはないのです。例えば、新型コロナウイルスでない人のデータが混じっているうえ、データがカバーしている人口分布に偏(かたよ)りがあるからです。しかし、災害時や有事のデータ分析で扱うデータは「データの質が悪い」のが普通です。あるデータでどのようなデータ分析をするのかは、データ分析者の腕の見せ所なのです。
データの質がどのように悪いのか把握した上でデータ分析し、人が解釈をする時にそのことを加味して結果を読み取り、どうなっているのか(もしくは、どうなりそうなのか)を洞察する必要があります。この時「こうあるべきだ」とか「こうなっているべきだ」、「こうしなければならない」など、人的な思いは一切排除し、心の平静を保ちデータを分析し解釈し見とおす必要があります。
(2)データ分析は、災害時の対処で生きる
少なくとも先進国では、政府機関の中にデータ分析を専門とするセクションがあると思います。彼ら・彼女らは、平事のデータ分析をするだけではなく、災害時や有事のためのデータ分析も行っていることでしょう。どちらかというと、災害時や有事に備えたデータ分析の方が重要性は高いでしょう。なぜならば、先行きが不透明だからです。その中で、より適切な選択をし続けたいからです。先行きが不透明な災害時や有事の時こそ、データ分析が灯(とも)すロウソクの明かりが求められるのです。
2. ベイズ的モデリングとシミュレーション
データ分析は、所詮(せん)過去のデータを使います。先行き不透明な状況下で、過去のデータを使いどのように先を見とおすのでしょうか?古典的には、ベイズ統計学を利用したデータ分析・活用です。例えば、過去のデータで構築した数理モデルを、直近のデータ(災害後のデータ)で”強く”修正していくのです。その修正された数理モデルを活用し、シミュレーションを行います。
シミュレーションを行う時、利用する数理モデルの説明変数(Input)を、値を固定する変数と、値を可変にする変数に分けます。値を固定する変数とは、あらかじめ値を設定する変数で、その値の設定パターンを「シナリオ」といいます。そのシナリオの下で、得たい結果を得るためには、何をすべきかを知るためにデータ分析を行います。その手掛かりが、可変にした変数に現れます。
(1)アパレル店舗の分析例
説明するのが難しかったので、もう少し分かりやすい例で説明します。あるアパレル店舗のデータ分析例です。例えば、災害前に比べて、何が売れ続けているのかを分析するのです。店舗を閉める影響も加味する必要があるので、売り上げの額ではなく、売上構成比を分析するのもいいでしょう。
例えば「靴下の全体に占める売上構成比が上がった」、「新作のジャケットの全体に占める売上構成比が悪い」などです。靴下は生活上必要なので購買し続けるが、値段の高い新作のジャケットは消費を抑えるために買い控えが起こった、などが分かります。
過剰に消費が冷え込み続ければ、靴下の売り上げに対する絶対額も減ることでしょう。例えば、PCのECサイトでよくあるオーダーメードサービスを、不足しているマスクで実施するのもいいかもしれません。再利用できる布マスクの形や色、柄、材質な...
3. 今回のまとめ
今回は「災害の予測は難しいが、対処ではデータ分析・活用(データサイエンス)が生きる」というお話しをしました。端的にいうと、「データを使った災害予測は非常に難しい」が「データを使った災害対応は可能」ということです。少なくとも先進国では、おそらく政府機関の中にデータ分析を専門とするセクションがあり、平事の平和な時のデータ分析だけではなく、災害時や有事のためのデータ分析も行っていると思います。どちらかというと、災害時や有事のためのデータ分析のほうが重要性は高いでしょう。なぜならば、先行きが不透明だからです。その中で、より適切な選択をし続けたいからです。
先行きが不透明な災害時や有事の時こそ、データ分析が灯すロウソクの明かりが求められるのです。このようなデータ分析・活用は「国レベルでないとできない」というデータ分析ではありません。企業レベルでも、個人レベルでも可能です。なぜならば、20年前と異なり、データ分析環境が安価になり身近にあるからです。
次回に続きます。