◆ データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは
最近流行りのキーワードです。
- AI(人工知能)
- DL(ディープラーニング)
- DX(デジタルトランスフォーメーション)
- データサイエンス
- IoT(モノのインターネット)
- デジタルマニュファクチュアリング
- xTech
- 自動運転
- AIスピーカー
- チャットボット
- ロボティクス
- データビジネス
- 〇〇プラットファーム など。
最近流行りのキーワードを並べると面白いことが分かります。すべてデータが必要ということです。今回は「データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは」というお話しです。
1、戦略的資産
戦略的資産とは何でしょうか、ここでは、戦略的資産をデータ分析・活用の安定・発展を図り、データ分析・活用の基盤を維持するために、安定的に確保する必要がある資産と定義します。
「戦略的」というワードからイメージできる通り「短期的・場当たり的」ではなく「長期的・全体的」といったところです。では、データ分析・活用の戦略的資産とは何でしょうか。
2、データ分析・活用の戦略的資産
データ分析・活用の戦略的資産として色々考えられますが、真っ先に挙げるとすれば、以下の2つでしょう。
- データそのもの
- データから知識獲得する能力
データは、どこからともなくいきなり湧いてきません。知識獲得能力も天から降ってはきません。
3、実験計画法
実験計画法というデータ分析・活用には欠かせない、データ収集技術があります。実験計画法とは、効率的なデータ収集を設計する技術で、分散分析という分析手法の概念と密接に結び付いています。生産系やマーケティング系では、今でも比較的よく使われています。マーケティング系では、コンジョイント分析という名前で使われていることが多いようです。さらに、ネット系のデータ分析・活用で比較的よく登場する、ABテストや多変量テストも実験計画法の一種です。
4、ディープラーニング
ディープラーニングは画像認識の世界で成功し、現在色々な分野で適応が試みられています。ニューラルネットワークの枠組みで語れることが多いわけですが、今やニューラルネットワークの枠組みで縛られるものではなくなりました。簡単にいうと、簡単な関数を組み合わせて「深い関数」(表現力の高い関数)を作り、そのパラメータをデータから推定する技術として語られることが多くなりました。つまり、ニューラルネットワークである必要はないわけです。
それはさておき、ニューラルネットワーク系のディープラーニングではある問題があります。以下の2つの問題は、今現在非常に大きな問題となっていることです。
- どうやってデータを収集するのか?
- どうやってアノテーション(データにラベルなどを与えて正解データを作る)するのか?
学習用のデータは、勝手に生成されません。誰かがデータを集め、学習用データを作る必要があります。従来型の機械学習は、対象分野(ドメイン)の知識が精度向上に大きく寄与していました。ディープラーニングは、どちらかというとデータと計算量が精度向上に寄与する技術です。今現在のディープラーニングの世界では、学習で使うデータそのものが大きな資産となっています。
5、ビッグデータの時代
実験計画法やディープラーニングの世界では、データを集め準備するというのが大きなポイントです。実験計画法は、データを集め準備するための技術ですし、ディープラーニングは、データ収集とアノテーション(データにラベルなどを与えて正解データを作る)次第です。今は、ビッグデータの時代ともいわれています。
簡単にいうと、量的には絶え間なく湧き出て、次々と蓄積され、質的には玉石混交の時代です。実験計画法やディープラーニングの世界とはちょっと異なる世界です。実験計画法は少量の良質なデータを取得する技術です。しかし玉石混交のデータをディープラーニングで学習させてはいけません。使えない何かが生まれます。
十分なデータがなければ、データを分析することも、データを活用することもできません。玉石混交のデータの場合、クレンジングするという手間暇が発生する可能性が高く、作業コストも莫大になるかもしれません。しかし、データが無ければ手間暇すらかけられないのです。それなりのデータを手にする機会や可能性が全く無い、ということです。そのため、少なくとも、データそのものは戦略的資産です。