災害時の対処とデータ分析・活用 データ分析講座(その169)

更新日

投稿日

データ分析

 

◆ 災害予測は難しいが、データを使った災害対応は可能

 データを使った災害予測は非常に難しいようです。特に、自然現象が相手となる天災は、データが揃(そろ)わないという理由から、非常に難しいものです。ここ数カ月の新型コロナウイルスがそれに該当することでしょう。例えば、1年前に新型コロナウイルスが猛威を振るうことを予測するのは、難しいということです。しかし今回の天災を含めた災害時の対処において、データ分析・活用(データサイエンス)は非常に有効です。今回は「災害の予測は難しいが、対処ではデータ分析・活用(データサイエンス)が生きる」というお話しをします。

【目次】

1. 全国約2万7000人「発熱続く」 厚労省とLINE調査
 (1)有事に扱うデータは「質が悪いもの」~そこは、データ分析者の腕の見せ所
 (2)データ分析は、災害時の対処で生きる
2. ベイズ的モデリングとシミュレーション
 (1)アパレル店舗の分析例
3. 今回のまとめ

 

1. 全国約2万7000人「発熱続く」 厚労省とLINE調査

 新型コロナウイルス対策のため、厚労省とLINEが共同で行った全国調査(3月末から4月上旬)の集計結果を要約すると次のようになります。

  • 4日以上発熱が続いていると答えた人が全体の0.11%(全国で約2万7000人)
  • 飲食店や外回りの営業などの職業グループは、発熱を訴える人の割合が平均の2倍の0.23%
  • 在宅で家事や育児をする人のグループは、発熱を訴える人の割合が平均の半分以下の0.05%

 なぜこのようなデータを集めたのかというと「クラスターの発生を封じ込めるため」という理由からだそうです。クラスターの発生を封じ込めるためには次の2点があります。

  • 発生したクラスターを早期に発見する
  • 当該クラスターに対して十分な対策を講じる

 

(1)有事に扱うデータは「質が悪いもの」~そこは、データ分析者の腕の見せ所

 このLINE調査のデータは、おそらくデータの質はあまりよろしくはないのです。例えば、新型コロナウイルスでない人のデータが混じっているうえ、データがカバーしている人口分布に偏(かたよ)りがあるからです。しかし、災害時や有事のデータ分析で扱うデータは「データの質が悪い」のが普通です。あるデータでどのようなデータ分析をするのかは、データ分析者の腕の見せ所なのです。

 データの質がどのように悪いのか把握した上でデータ分析し、人が解釈をする時にそのことを加味して結果を読み取り、どうなっているのか(もしくは、どうなりそうなのか)を洞察する必要があります。この時「こうあるべきだ」とか「こうなっているべきだ」、「こうしなければならない」など、人的な思いは一切排除し、心の平静を保ちデータを分析し解釈し見とおす必要があります。

(2)データ分析は、災害時の対処で生きる

 少なくとも先進国では、政府機関の中にデータ分析を専門とするセクションがあると思います。彼ら・彼女らは、平事のデータ分析をするだけではなく、災害時や有事のためのデータ分析も行っていることでしょう。どちらかというと、災害時や有事に備えたデータ分析の方が重要性は高いでしょう。なぜならば、先行きが不透明だからです。その中で、より適切な選択をし続けたいからです。先行きが不透明な災害時や有事の時こそ、データ分析が灯(とも)すロウソクの明かりが求められるのです。

 

2. ベイズ的モデリングとシミュレーション

 データ分析は、所詮(せん)過去のデータを使います。先行き不透明な状況下で、過去のデータを使いどのように先を見とおすのでしょうか?古典的には、ベイズ統計学を利用したデータ分析・活用です。例えば、過去のデータで構築した数理モデルを、直近のデータ(災害後のデータ)で”強く”修正していくのです。その修正された数理モデルを活用し、シミュレーションを行います。

 シミュレーションを行う時、利用する数理モデルの説明変数(Input)を、値を固定する変数と、値を可変にする変数に分けます。値を固定する変数とは、あらかじめ値を設定する変数で、その値の設定パターンを「シナリオ」といいます。そのシナリオの下で、得たい結果を得るためには、何をすべきかを知るためにデータ分析を行います。その手掛かりが、可変にした変数に現れます。

(1)アパレル店舗の分析例

 説明するのが難しかったので、もう少し分かりやすい例で説明します。あるアパレル店舗のデータ分析例です。例えば、災害前に比べて、何が売れ続けているのかを分析するのです。店舗を閉める影響も加味する必要があるので、売り上げの額ではなく、売上構成比を分析するのもいいでしょう。

 例えば「靴下の全体に占める売上構成比が上がった」、「新作のジャケットの全体に占める売上構成比が悪い」などです。靴下は生活上必要なので購買し続けるが、値段の高い新作のジャケットは消費を抑えるために買い控えが起こった、などが分かります。

 過剰に消費が冷え込み続ければ、靴下の売り上げに対する絶対額も減ることでしょう。例えば、PCのECサイトでよくあるオーダーメードサービスを、不足しているマスクで実施するのもいいかもしれません。再利用できる布マスクの形や色、柄、材質な...

データ分析

 

◆ 災害予測は難しいが、データを使った災害対応は可能

 データを使った災害予測は非常に難しいようです。特に、自然現象が相手となる天災は、データが揃(そろ)わないという理由から、非常に難しいものです。ここ数カ月の新型コロナウイルスがそれに該当することでしょう。例えば、1年前に新型コロナウイルスが猛威を振るうことを予測するのは、難しいということです。しかし今回の天災を含めた災害時の対処において、データ分析・活用(データサイエンス)は非常に有効です。今回は「災害の予測は難しいが、対処ではデータ分析・活用(データサイエンス)が生きる」というお話しをします。

【目次】

1. 全国約2万7000人「発熱続く」 厚労省とLINE調査
 (1)有事に扱うデータは「質が悪いもの」~そこは、データ分析者の腕の見せ所
 (2)データ分析は、災害時の対処で生きる
2. ベイズ的モデリングとシミュレーション
 (1)アパレル店舗の分析例
3. 今回のまとめ

 

1. 全国約2万7000人「発熱続く」 厚労省とLINE調査

 新型コロナウイルス対策のため、厚労省とLINEが共同で行った全国調査(3月末から4月上旬)の集計結果を要約すると次のようになります。

  • 4日以上発熱が続いていると答えた人が全体の0.11%(全国で約2万7000人)
  • 飲食店や外回りの営業などの職業グループは、発熱を訴える人の割合が平均の2倍の0.23%
  • 在宅で家事や育児をする人のグループは、発熱を訴える人の割合が平均の半分以下の0.05%

 なぜこのようなデータを集めたのかというと「クラスターの発生を封じ込めるため」という理由からだそうです。クラスターの発生を封じ込めるためには次の2点があります。

  • 発生したクラスターを早期に発見する
  • 当該クラスターに対して十分な対策を講じる

 

(1)有事に扱うデータは「質が悪いもの」~そこは、データ分析者の腕の見せ所

 このLINE調査のデータは、おそらくデータの質はあまりよろしくはないのです。例えば、新型コロナウイルスでない人のデータが混じっているうえ、データがカバーしている人口分布に偏(かたよ)りがあるからです。しかし、災害時や有事のデータ分析で扱うデータは「データの質が悪い」のが普通です。あるデータでどのようなデータ分析をするのかは、データ分析者の腕の見せ所なのです。

 データの質がどのように悪いのか把握した上でデータ分析し、人が解釈をする時にそのことを加味して結果を読み取り、どうなっているのか(もしくは、どうなりそうなのか)を洞察する必要があります。この時「こうあるべきだ」とか「こうなっているべきだ」、「こうしなければならない」など、人的な思いは一切排除し、心の平静を保ちデータを分析し解釈し見とおす必要があります。

(2)データ分析は、災害時の対処で生きる

 少なくとも先進国では、政府機関の中にデータ分析を専門とするセクションがあると思います。彼ら・彼女らは、平事のデータ分析をするだけではなく、災害時や有事のためのデータ分析も行っていることでしょう。どちらかというと、災害時や有事に備えたデータ分析の方が重要性は高いでしょう。なぜならば、先行きが不透明だからです。その中で、より適切な選択をし続けたいからです。先行きが不透明な災害時や有事の時こそ、データ分析が灯(とも)すロウソクの明かりが求められるのです。

 

2. ベイズ的モデリングとシミュレーション

 データ分析は、所詮(せん)過去のデータを使います。先行き不透明な状況下で、過去のデータを使いどのように先を見とおすのでしょうか?古典的には、ベイズ統計学を利用したデータ分析・活用です。例えば、過去のデータで構築した数理モデルを、直近のデータ(災害後のデータ)で”強く”修正していくのです。その修正された数理モデルを活用し、シミュレーションを行います。

 シミュレーションを行う時、利用する数理モデルの説明変数(Input)を、値を固定する変数と、値を可変にする変数に分けます。値を固定する変数とは、あらかじめ値を設定する変数で、その値の設定パターンを「シナリオ」といいます。そのシナリオの下で、得たい結果を得るためには、何をすべきかを知るためにデータ分析を行います。その手掛かりが、可変にした変数に現れます。

(1)アパレル店舗の分析例

 説明するのが難しかったので、もう少し分かりやすい例で説明します。あるアパレル店舗のデータ分析例です。例えば、災害前に比べて、何が売れ続けているのかを分析するのです。店舗を閉める影響も加味する必要があるので、売り上げの額ではなく、売上構成比を分析するのもいいでしょう。

 例えば「靴下の全体に占める売上構成比が上がった」、「新作のジャケットの全体に占める売上構成比が悪い」などです。靴下は生活上必要なので購買し続けるが、値段の高い新作のジャケットは消費を抑えるために買い控えが起こった、などが分かります。

 過剰に消費が冷え込み続ければ、靴下の売り上げに対する絶対額も減ることでしょう。例えば、PCのECサイトでよくあるオーダーメードサービスを、不足しているマスクで実施するのもいいかもしれません。再利用できる布マスクの形や色、柄、材質などをEC上でオーダーするのです。そのサービスの状況を、データを使い分析し、より良いものへと適応し続けることができることでしょう。

 

3. 今回のまとめ

 今回は「災害の予測は難しいが、対処ではデータ分析・活用(データサイエンス)が生きる」というお話しをしました。端的にいうと、「データを使った災害予測は非常に難しい」が「データを使った災害対応は可能」ということです。少なくとも先進国では、おそらく政府機関の中にデータ分析を専門とするセクションがあり、平事の平和な時のデータ分析だけではなく、災害時や有事のためのデータ分析も行っていると思います。どちらかというと、災害時や有事のためのデータ分析のほうが重要性は高いでしょう。なぜならば、先行きが不透明だからです。その中で、より適切な選択をし続けたいからです。

 先行きが不透明な災害時や有事の時こそ、データ分析が灯すロウソクの明かりが求められるのです。このようなデータ分析・活用は「国レベルでないとできない」というデータ分析ではありません。企業レベルでも、個人レベルでも可能です。なぜならば、20年前と異なり、データ分析環境が安価になり身近にあるからです。

 

 次回に続きます。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
取り組むテーマを経験・勘・度胸で決定 データ分析講座(その161)

  ◆ KKDををめぐる摩訶不思議な現象  KKD(経験・勘・度胸)を悪の根源とみなし、データ分析・活用で排除すると意気込む風景を何度か...

  ◆ KKDををめぐる摩訶不思議な現象  KKD(経験・勘・度胸)を悪の根源とみなし、データ分析・活用で排除すると意気込む風景を何度か...


新規顧客のターゲット選定 データ分析講座(その88)

◆ 受注履歴から探る新規顧客ターゲット選定のためのデータ分析  受注に関するデータはどのような会社にもある価値のあるデータです。これがなければ売上が...

◆ 受注履歴から探る新規顧客ターゲット選定のためのデータ分析  受注に関するデータはどのような会社にもある価値のあるデータです。これがなければ売上が...


評価指標の異常判断とは データ分析講座(その245)

  ビジネス活動をしていると、何かしらの指標を眺めることが多々あります。例えば、売上や受注件数、問い合せ件数、サイトのPV(ページビュー)...

  ビジネス活動をしていると、何かしらの指標を眺めることが多々あります。例えば、売上や受注件数、問い合せ件数、サイトのPV(ページビュー)...


「情報マネジメント一般」の活用事例

もっと見る
個票データの共用化でコストダウン

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...

 データ解析の効率は、生データとその整理の仕方で大きく異なると言えます。 例えば、アンケート結果は単なる生データであり、そのままでは解析出来ません。解析の...


‐技術開発の目標について 第1回‐  製品・技術開発力強化策の事例(その15)

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...

 前回の事例その14に続いて解説します。製品開発を目指している企業の中には、テ-マが見つかったら、または、アイデアが閃いたら開発に取り組む。そのような淡い...


ソーシャルメディアデータの解析事例:異分野研究から得られる共通した目的とは

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...

 2020年、コロナウィルス感染の問題が大きくなり始めた頃、少人数の開催ということで、ソーシャルメディアデータ解析を専門にされている先生の講演会を聞く...