データ分析・活用のアプローチとは データ分析講座(その112)

更新日

投稿日

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でい...

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でいうとデータサイエンティストという名のデータ分析者です。20年前と比べ、データの種類と量は確実に増え、分析環境も非常に良くなりました。そんな中、変わらないことがあります。

 それはデータ分析・活用のアプローチです。今も昔も大きくは変わらない印象があります。例えば、有名なCRISP-DM(CRoss-Industry Standard Process for Data Mining)というデータ分析・活用のアプローチは今も昔も使われ、それなりの成果を生み続けています。

ビジネス理解

データ理解

データ準備

モデル構築

評価

展開

 一方通行ではなく、都度戻ります。ソフトウェア開発と異なり、進めながら明らかにしていく研究調査アプローチでもあります。実ビジネスに展開するまで何度も手戻りしながら、ぐるぐる回っていきます。どれだけ高速に回すかがキモになってきます。

 この中で最重要なのが「ビジネス理解」と「データ理解」のデータ分析(「データ準備」や「モデル構築」)前です。その次に重要なのが、データ分析(「データ準備」や「モデル構築」)後の「評価」と「展開」です。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
最近注目を浴びてきた説明可能AIとは データ分析講座(その203)

    機械学習で構築した数理モデルが、ブラックボックス化するケースは少なくありません。そのような中、最近よく聞くキーワードに「X...

    機械学習で構築した数理モデルが、ブラックボックス化するケースは少なくありません。そのような中、最近よく聞くキーワードに「X...


中小製造業のDXへの取り組み(その3)

【中小製造業のDXへの取り組み 連載へのリンク】 1、中小製造業の2つの事業パターン 2、受託製造サービス業へ脱皮する 3、経済産業省DX Se...

【中小製造業のDXへの取り組み 連載へのリンク】 1、中小製造業の2つの事業パターン 2、受託製造サービス業へ脱皮する 3、経済産業省DX Se...


データドリブン思考はやめる データ分析講座(その63)

◆ データドリブン思考ではデータの価値は生み出せない。データの価値は逆算アプローチで創造する  データの価値は利活用にあります。でも、その利活用が分...

◆ データドリブン思考ではデータの価値は生み出せない。データの価値は逆算アプローチで創造する  データの価値は利活用にあります。でも、その利活用が分...


「情報マネジメント一般」の活用事例

もっと見る
現場のExcel依存に注意しよう

 マイクロソフトの「Excel」は企業の業務遂行にとって欠かせないツールになりました。数字の集計、グラフの作成にとどまらず、作業伝票の発行、作業の管理、資...

 マイクロソフトの「Excel」は企業の業務遂行にとって欠かせないツールになりました。数字の集計、グラフの作成にとどまらず、作業伝票の発行、作業の管理、資...


‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...


人的資源マネジメント:製品開発の滞留を引き起こすファイルとは(その2)

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...

 今回は、PDM/PLMに代表される製品開発業務のIT化をどのように考え、進めるのがよいのかについて解説します。    前回まで続けていたテ...