データ分析・活用のアプローチとは データ分析講座(その112)

更新日

投稿日

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でい...

情報マネジメント

◆ なぜ今、データサイエンスが必要なのか?

 データサイエンスという用語は、数十年前からありました。2000年代初期のころ、私が所属していたコンサルティング会社の部署名に「データサイエンス」という言葉がついていたぐらいでしたから。データサイエンスが必要な理由は、今も昔も変わりません。変わったのは、データサイエンスをする人財が至る所で必要になったことぐらいです。今回は「なぜ今、データサイエンスが必要なのか?」というお話しです。

1、 データ分析という仕事

 「データ分析者」「データ分析官」「データマイナー」「データサイエンティスト」など、データを分析する人の名称は色々あります。最近、データ分析という職業の求人が急激に増えました。私の知る限りでは、1990年代には既にこの職業はありましたし当時から注目されていました。この頃、ITベンチャーと共にデータ分析系のベンチャーもいくつか設立されました。当時のデータ分析系のベンチャーの多くは、数名から数十名程度と小ぶりな企業が多い印象があります。

2、データのビッグデータ化

 「情報爆発」という言葉が2005年頃から聞かれるようになりました。情報爆発とともに「情報疲労」という言葉もありました。それが2010年代中頃からビッグデータという言葉で言い換えられるようになりました。情報爆発とはデータが爆発的に増えること。情報疲労はそれに対処するのが困難なことです。そして、ビッグデータは情報疲労を起こすことなく爆発的に増えたデータに対し上手く対処すること。感覚的にはそのような感じだったかと思います。爆発的に増えたデータに対し、どのように向き合いビジネスチャンスに繋げたかで、現在大きな差が生まれました。

3、データサイエンスとは何か?

 ビジネスという視点で考えると、データサイエンスとは、データとビジネスを結びつけることです。もう少し一般化すると、データサイエンスとは、データとその応用領域とを結びつけることです。応用領域は、医療かもしれませんし、軍事かもしれませんし、農業かもしれません。要するに、ビジネスの文脈で考えると、増加する一方のデータとビジネスの架け橋が、データサイエンスなのです。そのデータサイエンスを実現する人が、データサイエンティストということになるでしょう。

4、データがある限り、データサイエンスは廃れない

 データとビジネスの間の架け橋が新たに必要な限り、データサイエンスは必要になります。例えば、集まるデータが同じで、ビジネスも変化しないのであれば、その間の架け橋も同じで問題ありません。

 しかし幸か不幸かデータは現在も増加中で、そしてビジネスも時間の流れとともに変化します。つまり、ビジネスの変化と取得するデータに応じて、架け橋を改修するか構築し直すかが必要になるのです。

5、20年前はなかったFacebook

 例えば広告のデータ分析の分野。20年前のデータ分析が通用するのか、10年前の統計や機械学習モデルで対応可能なののでしょうか。そのままでは、通用しませんし対応もできないでしょう。例えば20年前の主流は、テレビCMや雑誌広告、新聞広告などです。

 この時代のデータ分析がそのまま通用するわけはありませんし、統計や機械学習モデルを使って効果検証や予測なども無理があることでしょう。インターネット系の広告が考慮されていないからです。広告・販促の手段は常に進化し、その都度新しいものが登場しています。

6、新製品や新設備、新材料

 このような話しは、マーケティングなどの分野だけではありません。生産の現場でも似たようなことは起こっています。製品のライフサイクルが短くなったことや設備の進化スピードなどにより、20年前や10年前のデータ分析がそのままでは通用しなくなっています。

 20年、10年前では生産品も異なれば、得られるデータももちろん異なります。ブラウン管テレビ生産時のデータ分析を、薄型液晶テレビで活用するには無理が出てくることでしょう。設備を変えれば、センサーから発生するデータも異なってきます。利用可能なデータの期間を延ばそうと、旧設備と共通したデータだけを使って分析するのは、ナンセンスですし非常にもったいないです。

 ある製造業では、ある製品の歩留まりが非常に良くなったタイミングでその製品の販売が終了。まだまだ歩留まりの改善余地の高い新製品に対し改善活動がスタートするという、終わりのない戦いを続けているところもありました。

7、共通してるのは、データ分析・活用のアプローチだけ

 時代が変わればビジネス環境も変わり、取得されるデータも変わる。そのため、データとビジネスの架け橋であるデータサイエンスは常に変化と進化を求められるようです。その変化に対応するのは、今でいうとデータサイエンティストという名のデータ分析者です。20年前と比べ、データの種類と量は確実に増え、分析環境も非常に良くなりました。そんな中、変わらないことがあります。

 それはデータ分析・活用のアプローチです。今も昔も大きくは変わらない印象があります。例えば、有名なCRISP-DM(CRoss-Industry Standard Process for Data Mining)というデータ分析・活用のアプローチは今も昔も使われ、それなりの成果を生み続けています。

ビジネス理解

データ理解

データ準備

モデル構築

評価

展開

 一方通行ではなく、都度戻ります。ソフトウェア開発と異なり、進めながら明らかにしていく研究調査アプローチでもあります。実ビジネスに展開するまで何度も手戻りしながら、ぐるぐる回っていきます。どれだけ高速に回すかがキモになってきます。

 この中で最重要なのが「ビジネス理解」と「データ理解」のデータ分析(「データ準備」や「モデル構築」)前です。その次に重要なのが、データ分析(「データ準備」や「モデル構築」)後の「評価」と「展開」です。

   続きを読むには・・・


この記事の著者

高橋 威知郎

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)

データネクロマンサー/データ分析・活用コンサルタント (埋もれたデータに花を咲かせる、データ分析界の花咲じじい。それほど年齢は重ねてないけど)


「情報マネジメント一般」の他のキーワード解説記事

もっと見る
MPUとは何か?

  電子機器の多くには、マイコンが用いられていますが、マイコンは、それらの機器の内部で部品として何をしているのでしょうか。マイコンはそれら...

  電子機器の多くには、マイコンが用いられていますが、マイコンは、それらの機器の内部で部品として何をしているのでしょうか。マイコンはそれら...


最近多いケーススタディ③「お勧め商材のレコメンド」 データ分析講座(その190)

    データを使い販売力を効率的に高めるセールスアナリティクスには、3つの典型的なテーマがあります。 新規顧客の獲得 既...

    データを使い販売力を効率的に高めるセールスアナリティクスには、3つの典型的なテーマがあります。 新規顧客の獲得 既...


データと洞察で戦略的意思決定を導く:データ分析講座(その333)

現代の急速に変化するビジネス環境で競争優位を保つためには、データとその中からの洞察を上手く活用することが不可欠です。データ駆動のアプローチが主流となる...

現代の急速に変化するビジネス環境で競争優位を保つためには、データとその中からの洞察を上手く活用することが不可欠です。データ駆動のアプローチが主流となる...


「情報マネジメント一般」の活用事例

もっと見る
‐情報収集で配慮すべき事項(第3回)‐  製品・技術開発力強化策の事例(その11)

 前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...

 前回の事例その10に続いて解説します。ある目的で情報収集を開始する時には、始めに開発方針を明らかにして、目的意識を持って行動する必要があります。目的を明...


Web上で試作受注するツールを成功させるポイントとは

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...

        今回は、「Web上で試作受注するツール」を成功させるポイントについて解説します。次の2点がポイントで、この2つを「最優先」に考える必...


‐販路開拓に関する問題 第1回‐  製品・技術開発力強化策の事例(その17)

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...

 前回の事例その16に続いて解説します。開発が完了したから販売先を探す。そのような考え方で開発に従事することは根本的に間違っている事は既に述べました。開発...